趣谈与相关的概率统计知识——天才

根据我当前认知,人工智能产品经理又可细分为:

一.区分不同技术领域;

二.区分产品面向用户对象;

三.区分产品终端形态;

四.区分日常职责:注重交互设计(PD-design PM)、注重市场运营推广(PMM-market PM)、注重优化算法性能+元能力策略定义(TPM-technology PM)、注重整体场景落地规划(SPM-strategy PM)等,不同公司对AIpm的职责划分不一致,且有的product manager 同时也需要担任project manager的角色。

上面的细分类如果有兴趣听我进一步具体讲讲我浅薄认知的欢迎留言。本系列要讲概率统计知识是和TPM日常工作息息相关,因为TPM的工作职责之一就是协助算法工程师优化算法性能,算法模型存在不同程度的误判情况,而制定结合概率统计知识的元能力策略、优化训练数据、优化颗粒度定义、优化采集图像等都是降低算法在实际应用场景下的误判情况。

说句实在话,概率统计并非我的强项,哦,不,准确来说我完全就是一枚渣渣,说的有不当的地方请尽情吐槽~

一》谷歌面试题引发的“血案”~

google曾有这么一道面试题目,引出过无数高手头脑风暴的“血雨腥风”:

译文:

在100层高的大楼,你有2个一模一样的鸡蛋,需要确认把鸡蛋扔下去而不摔坏的最高楼层。问题:你需要扔多少次才能确定答案。提出一个计算法则找到在最坏情况下扔的最少次数。

情景解析:

1.方法一:逐层检验

最简单的一个方法,就是将第一颗鸡蛋从第一层开始,逐层扔出直至找到将其摔坏的楼层,最极端情况下max次数为100。这种方法会导致求得的扔鸡蛋次数并非最少且鸡蛋资源无充分利用。

2.方法二:二分法

将第一颗鸡蛋从第五十层扔出,第五十层没破就从第七十五(50+25)层扔出,第五十层破了就在1-49层楼层间,用第二颗鸡蛋从1-49层最低层逐一检测,以此类推,最极端情况下max次数为50。

3.方法三:划分N段相等区间检验

4.方法四:纳什均衡

纳什均衡有2个知名的案例分别是囚徒困境和硬币正反游戏,其定义是:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策略组合(s1*,…,sn*)中,任一博弈方i的策略si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。

设S(n)为楼层数,max(S1,(S2-S1-1)+1,(S3-S2-1)+2...)=n(n+1)/2,对于100层的情况,n(n+1)/2>=100,i>=14,则最极端情况下max次数为14。

4.方法五:( ̄∇ ̄)我选择把2枚鸡蛋都吃了~本来我就那么点智商,还让我计算得这么费劲。

以上以一道面试题引出概率统计知识的重要性,而概率统计知识又是怎么降低算法模型的误判情况呢?

二》“贝叶斯推理”统计学的应用

AI(人工智能)在识别判断分类的应用,就像电商顾客在店铺浏览商品时,推测该顾客究竟是“来买东西的”,还是“不买东西的”;推荐该顾客是“会咨询客服的”,还是“不咨询客服的”。如何来推测?

1.步骤一:确定先验概率

在此场景下顾客分为两类:来买东西的、不买东西的。假设电商售前客服根据以往数据统计获得“每10位顾客中就有3位是来买东西的”的结论且所有顾客一定属于两种中的一种,则根据历史数据统计的类型比例来进行数值分配:“来买东西的”顾客的概率就是30%,“不买东西的”顾客的概率就是70%。

我们把30%和70%分别称为两类顾客的先验分布,即在识别对象发生下一步行为前进行的事先概率判断。在贝叶斯统计学中,有个专有名词叫“先验概率”。就像我们在通过AI计算机视觉技术进行1vs1人脸识别的身份验证一样,我们先拿部分历史数据进行灰度测试,得到“是本人”的概率为0.75和“非本人”的概率为0.25。

“先验概率”并不能帮助我们在实际场景下明确该位顾客是“买东西的”还是“不买东西的”,但能帮助我们形成对识别对象的整体感知,进一步结合该对象将采取某种行为(比如是否咨询客服)的条件概率来推测每个行为发生的可能性,有助于我们整理思路。

2.步骤一:结合条件概率

假设电商售前客服根据以往数据统计获得“来买东西的顾客有80%会咨询客服,20%不会咨询客服;不买东西的顾客有40%会咨询客服,60%不会咨询客服的”的结论,表示“某一特定类别(不同识别对象)采取各种行动的概率”在统计学中被称为“条件概率”,则顾客咨询客服的条件概率为:

推测出每种行为的条件概率究竟有什么作用?比如,在该电商售前场景下,当我们预估到客服整体会有多大的比例人群会咨询客服,当我们设定下个电商大促的客流量目标的情况下,我们便也能预估我们需要有多少客服人手。

同理,当我们通过AI计算机视觉技术进行1vs1人脸识别的身份验证,且假设灰度的样本数据跟实际场景的数据的各项影响因素保持一致,预测到整体人群“是本人”的概率为0.75和“非本人”的概率为0.25,并结合“非本人”群体做出各类犯罪行为的概率,进而预估危险事件发生的可能性,从而应用在安全监测场景。

就如图前面提到的“囚徒困境博弈”的纳什均衡经典案例。

3.“囚徒困境博弈”案例

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:

引用--bai du 科学

这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。

但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人都会被判监8年。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。纳什均衡很好地诠释了市场经济的现象。

THE END
0.大学2025|对话舒德干院士:AI时代,知识积累仍然非常重要|舒德干|古近日,古生物学家、中国科学院院士、西北大学地质系教授舒德干在接受澎湃新闻采访时表示,在“AI(人工智能)+教育”成趋势的背景下,目前AI已经成功应用于化石的快速鉴定和分类等方面,今后将逐步深入到生物演化和生态环境重建。他希望青少年都多学些AI相关知识,以便应用到各个领域的研究中。同时,他认为,在AI时代,知识的jvzq<84m0uooc7hqo0io1jwvkerfa>5664>25:5a34ib;Bkfg2812;jhos4ivvq
1.河南事业单位公共基础知识:计算机网络相关知识【导读】华图河南事业单位考试网同步河南华图发布:河南事业单位公共基础知识:计算机网络相关知识,详细信息请阅读下文!如有疑问请加【河南事业单位考试交流群汇总】,备考河南事业单位考试,为你推荐事业单位备考用书,面授课程。更多资讯请关注河南华图事业单位微信公众号(hnsydw666),微信号:(huatuhn123) 。 jvzquC41jc4iwjyw0eun1;544173494727=15<3jvor
2.人工智能复习题(答案)要想让机器具有智能,须让机器具有知识。 人工智能复习题(答案) 一:单选题1. 人工智能的目的是让机器能够(D),以实现某些脑力劳动的机械化。 A. 具有完全的智能B. 和人脑一样考虑问题C. 完全代替人D. 模拟、延伸和扩展人的智能2. 下列关于人工智能的叙述不正确的有(C)。 A. 人工智能技术它与其他科学技术jvzquC41o0972mteu0tfv8iqe17e3?5;4:670qyon
3.人工智能知识大全.pdf(2)具有经验性及不确定性的知识,而且相关领域中对这些知识没有严格、统一的理论。如:医疗诊断、故 障诊断等方面的知识。 (3)领域问题的求解过程可被表示为一系列相对独立的操作,而且每个操作可被表示为一条或多条产生式规 则。 2.4 框架表示法 2.4.1 框架理论 1975年美国著名AI学者Minsky在其论文“A jvzquC41oc~/dxtm33>/exr1jvsm1;5431674A4842;15;6722644990ujzn
4.全球人工智能专利申请哪家强?腾讯排第二,第一你肯定想不到全球人工智能相关专利申请最多的国家或地区 通常,人们会认为孵化硅谷巨头的美国在人工智能相关知识产权方面遥遥领先,但银柿财经从全球人工智能创新数据监控平台获取的数据,着实让人眼前一亮。从2000年到今年6月底的数据显示,中国在人工智能相关的知识产权申请占比超过了50%,是美国的一倍多。 jvzquC41pg}t0qjzwp4dqv44249.2B22718229:376>/j}rn
5.AI的100个知识点7 数据挖掘(DM):从大量数据中提取知识和信息的过程。 8 数据科学(DS):使用数学、统计学和计算机科学等工具来分析和解决现实世界中的数据问题。 9 数据预处理(Data preprocessing):在进行机器学习或数据挖掘之前,对原始数据进行处理,包括数据清洗、特征选择等。 jvzquC41yy}/lrfpuj{/exr1r171g:ghdg9edB
6.科技文献知识AI引擎项目网站:https://sciaiminer.las.ac.cn/ 项目背景 科技文献蕴含人类知识、反映科研成果,是文献情报机构知识服务和情报分析的基础。项目针对文献情报机构迫切需要提升智能技术方法手段,将掩藏在海量科技文献中的深度知识内容有效挖掘出来并加以充分利用的重要问题,突破智能化关键技术,研发知识服务与情报分析自主软件。 jvzq<84uekkoirsg0ngt0jh0ep5Qtxogevy
7.AI知识库百聆・知识管家能整合各类资料,结构化萃取信息并校验一致性,帮你打造专属 AI 01:34 智效启迪·3天前 如果你希望你的企业也能在数字化浪潮中脱颖而出,不妨抓住这个时机,获取 AI 企业知识库的方案,开启本地知识库搭建之旅,让企业在知识管理和运营效率上实现质的飞跃。 36年老玩家·2个月前 评测国内主流AI知识库产品,聚焦数据整合、AI交互、jvzquC41tgsbtt3uqj{/exr1egrm1ufdgn576k=f6;716>g7928e89h58f7
8.AI知识汇总总结.docxAI知识汇总总结.docx 39页内容提供方:赤壁怀古 大小:3.29 MB 字数:约2.79万字 发布时间:2023-05-14发布于安徽 浏览人气:18 下载次数:仅上传者可见 收藏次数:0 需要金币:*** 金币 (10金币=人民币1元)AI知识汇总总结.docx 关闭预览 想预览更多内容,点击免费在线预览全文 免费在线预览全文 衡量机器jvzquC41o0hpqt63:0ipo8mvon532;8127741>6323634<92328167xjvo