a ‘º”hyã@sjUddlmZddlZddlmmZddlmZddlm Z gZ eee d<ejjGdd„dƒƒZdS)é)ÚOptionalN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c@sdeZdZdeeeeeefeeeeeeedœ dd„Zee ed œd d„Z ee edœd d„ZdS)Ú_FunctionalAdamWçü©ñÒMbP?©gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?ç:Œ0âŽyE>ç{®Gáz„?F) ÚparamsÚlrÚbetasÚepsÚweight_decayÚamsgradÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCs$tddd|ks td|›ƒ‚d|ks6td|›ƒ‚d|dkrNdksbntd|d›ƒ‚d|d krzdksŽntd |d ›ƒ‚d|ks¤td|›ƒ‚|||d|d |dœ|_||_||_||_| |_tj t tjt ttjffi¡|_ t|ƒdkr| std ƒ‚d|i|_dS)Né)Ú stacklevelçzInvalid learning rate: zInvalid epsilon value: rgð?z#Invalid beta parameter at index 0: éz#Invalid beta parameter at index 1: zInvalid weight_decay value: )rrÚbeta1Úbeta2rz%optimizer got an empty parameter listr)rÚ ValueErrorÚdefaultsrrrrÚtorchÚjitZannotateÚdictrÚstrÚstateÚlenÚparam_group)Úselfrrr rrrrrrr©r%úV/var/www/auris/lib/python3.9/site-packages/torch/distributed/optim/functional_adamw.pyÚ__init__s2 û$z_FunctionalAdamW.__init__)ÚparamÚgradcCsvg}g}g}g}g}g}t |¡} |dur>| |¡| |¡||jvr¬i|j|<|j|} t d¡| d<tj|tjd| d<tj|tjd| d<|jr¬tj|tjd| d<|j|} | | d¡| | d¡|jræ| | d¡| | d¡t ¡dt j |||||||j|j|jd|jd|jd |jd |jd|j |jdd| dWdƒn1sh0YdS) NrÚstep©Z memory_formatÚexp_avgÚ exp_avg_sqÚmax_exp_avg_sqrrrrr©rrrrrrrrrZ grad_scaleZ found_infÚhas_complex)rÚ is_complexÚappendr!ÚtensorÚ zeros_likeÚpreserve_formatrÚno_gradÚFÚadamwrrrr)r$r(r)Úparams_with_gradÚgradsÚexp_avgsÚexp_avg_sqsÚmax_exp_avg_sqsÚstate_stepsr0r!r%r%r&Ú step_paramGsf ÿ ÿ ÿ îz_FunctionalAdamW.step_param)Ú gradientsc CsÞ|jd}g}g}g}g}g}g}t|ƒt|ƒkrXtddt|ƒ›ddt|ƒ›ƒ‚d} t|jd|ƒD]î\} }|durl| t | ¡O} | | ¡| |¡| |jvri|j| <|j| }t d¡|d<tj | tj d |d <tj | tj d |d<|jrtj | tj d |d<|j| }| |d ¡| |d¡|jrL| |d¡| |d¡qlt ¡dt j|||||||j|j|jd |jd|jd|jd|jd|j|jdd| dWdƒn1sÐ0YdS)NrzEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: Frr*r+r,r-r.rrrrrr/)r#r"rÚziprr1r2r!r3r4r5rr6r7r8rrrr) r$r@rr9r:r;r<r=r>r0r(Zgradientr!r%r%r&r*„s| ÿþÿ ÿ ÿ ÿ îz_FunctionalAdamW.stepN) rrr r FFFFF)Ú__name__Ú __module__Ú__qualname__ÚlistrÚfloatÚtupleÚboolr'rr?r*r%r%r%r&rs.õ õ-=r)ÚtypingrrZtorch.optim._functionalZoptimZ_functionalr7rZ,torch.distributed.optim._deprecation_warningrrrEr Ú__annotations__rÚscriptrr%r%r%r&Ús