a ‘º”h+ã@sjUddlmZddlZddlmmZddlmZddlm Z gZ eee d<ejjGdd„dƒƒZdS)é)ÚOptionalN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c @sLeZdZd eeeeeefeeeeedœdd„Zee ed œd d„Z dS)Ú_FunctionalAdamaxçü©ñÒMbP?©gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?ç:Œ0âŽyE>çF)ÚparamsÚlrÚbetasÚepsÚweight_decayÚforeachÚmaximizeÚ_allow_empty_param_listc Cstddd|ks td|›ƒ‚d|ks6td|›ƒ‚d|dkrNdksbntd|d›ƒ‚d|d krzdksŽntd |d ›ƒ‚d|ks¤td|›ƒ‚|||d|d |dœ|_||_||_tj ttj tt tj ffi¡|_t|ƒdkr |s td ƒ‚d|i|_ dS)Né)Ú stacklevelr zInvalid learning rate: zInvalid epsilon value: rgð?z#Invalid beta parameter at index 0: éz#Invalid beta parameter at index 1: zInvalid weight_decay value: )rrÚbeta1Úbeta2rz%optimizer got an empty parameter listr)rÚ ValueErrorÚdefaultsrrÚtorchÚjitZannotateÚdictrÚstrÚstateÚlenÚparam_group) Úselfrrr rrrrr©r"úW/var/www/auris/lib/python3.9/site-packages/torch/distributed/optim/functional_adamax.pyÚ__init__s. û$z_FunctionalAdamax.__init__)Ú gradientscCs˜|jd}g}g}g}g}g}t|ƒt|ƒkrTtddt|ƒ›ddt|ƒ›ƒ‚d}t|jd|ƒD]º\} } | durh|t | ¡O}| | ¡| | ¡| |jvrîi|j| <|j| }t d¡|d<tj | tj d |d <tj | tj d |d<|j| }| |d ¡| |d¡| |d¡qht ¡Vtj ||||||jd|jd |jd|jd|jd|j|j|d Wdƒn1sŠ0YdS)NrzEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: Fr Ústep)Z memory_formatZexp_avgZexp_infrrrrr)rrrrrrrÚhas_complex)r rrÚziprZ is_complexÚappendrZtensorZ zeros_likeZpreserve_formatZno_gradÚFZadamaxrrr)r!r%rZparams_with_gradZgradsZexp_avgsZexp_infsZstate_stepsr'ÚparamZgradientrr"r"r#r&Csd ÿþÿ ÿ ÿ óz_FunctionalAdamax.stepN)rrr r FFF)Ú__name__Ú __module__Ú__qualname__ÚlistrÚfloatÚtupleÚboolr$rr&r"r"r"r#rs$÷ ÷)r)ÚtypingrrZtorch.optim._functionalZoptimZ_functionalr*rZ,torch.distributed.optim._deprecation_warningrrr/rÚ__annotations__rÚscriptrr"r"r"r#Ús