AI 知识库Ai math basics信息论 (Information Theory)edit核心 信息量 熵(Entropy) 联合熵 条件熵 互信息 交叉熵(Cross-Entropy) KL散度(Kullback-Leibler Divergence) 大模型应用 损失函数 交叉熵损失是衡量预测分布与真实分布之间差异的度量。 注意力机制 计算注意力权重时,softmax 操作与概率分布和熵的关联。 强化学习 策略梯度的优化目标中可能包含熵正则项,以鼓励探索。 TRPO / PPO 算法的核心是 KL 散度约束。 模型压缩与量化 量化信息损失的评估。 贡献者Mira190微积分与优化 (Calculus & Optimization)微积分与优化核心概念及其在大模型中的应用线性代数 (Linear Algebra)线性代数核心概念及其在大模型中的应用