第605章 多元分类用softmax函数,用故事解释(1 / 2)

职场小聪明 翟晓鹰 1010 字 6天前

用故事解释Softax函数

故事背景:选举村的村长选举

在一个叫“选举村”的地方,每四年一次,村民们都要选出一位新村长。这次,有四位候选人:

?阿强(擅长务农,村民对他比较熟悉)

?小美(善于管理,做过村委会秘书)

?老李(年纪较大,经验丰富,但村民对他评价不一)

?张三(刚来村子不久,大家对他了解不多)

选举日,村民们需要根据他们的支持度,选择一个人投票。但村民的支持度并不是“非黑即白”的,每个人对每位候选人的好感度都不同。为了更公平地衡量大家的意愿,村子里的智者发明了一种方法,叫Softax规则。

Softax的运作方式

智者让每个村民给四位候选人打分,比如某个村民的打分是:

?阿强:8分

?小美:6分

?老李:5分

?张三:3分

但是,这些分数只是相对的,我们需要转换成“概率”来反映这个村民的最终选择倾向。Softax规则的做法是:

1.先用指数函数(e的指数)放大分数,避免负分影响决策:

2.计算这些指数值的总和:

3.再计算每个候选人的支持度占比:

这样,每个人最终的选择概率就会落在到之间,并且所有候选人的概率加起来是(保证了最终一定会选出一位村长)。

比喻解释:冰淇淋店的选择

假设你走进了一家冰淇淋店,店里有四种口味:

?巧克力(你最爱)

?香草(你觉得还行)

?草莓(一般般)

?抹茶(你不太喜欢)

如果你只是随意选,你可能会纠结,但Softax规则就像是在你的大脑里装了一个“选择助理”,它根据你对每个口味的喜爱程度(打分),帮你转换成最终的选择概率。例如:

?你对巧克力的喜爱度是9分,香草7分,草莓5分,抹茶2分。

?Softax把这些分数转化成指数值,然后归一化成概率:

结果就是,你有最高的概率选择巧克力,较低的概率选择香草,几乎不会选抹茶。

总结

Softax函数的本质是:

1.将原始分数(打分)转换成概率,使得总和为1。

2.指数放大优势,让分数高的选项更有可能被选中。

3.让所有选项都有可能被选中(即使得分最低的选项概率也不会完全是0)。

无论是在选举、推荐系统还是AI分类任务中,Softax都像一个“理性的选择助手”,帮我们做出合理的决策。