【豆瓣鉴书团】数据、因果、悖论、推理和机器人

Dahlia
2019-07-24 看过

作为学统计学出身现在从事AI行业的一名读者,其实一年前就开始读这本书的英文版本了,不过卡在ladder of Causation没有进行下去。这次的中文版因为是专业知识、熟悉领域,加上有先验阅读经验,读起来很快又超有趣。然而因为读的太开心,有些内容表达可能会因为读得太快、自以为熟悉其实并不了解领会而被错过,换言之,被大脑已经建立的语义模型欺骗,”告知”自己已经懂了。

基于此,专业上的收获还是有一些的:

  1. "阻碍因果推断这一科学诞生的最大障碍,是我们用以提出因果问题的词汇和我们用以交流科学理论的传统词汇之间的鸿沟。" 上一本书在读语言学的邀请,公式没有方向、条件概率也没有方向,统计学里常提的idd(independently identically distributed)也没有方向,当现实世界在不同的context下描述问题,并且有一种context因为历史社会等种种原因掌握了话语权(哈哈话语的话语权),我们自然就丧失了对于新科学的深度思考。
  2. 数据和模型 在互联网行业待一阵子会听到以下cliche, “数据为王””数据是资产、核心及价值。”“数据在哪儿人才去哪儿。” 我们怎么在用数据呢?Seeing, mining, not even playing with it. 规则系统、专家系统、人工标注系统,仅仅是帮助我们看见。诚然看见已经不容易了,毕竟大部分人只想看见自己想看的东西,但是BI工具、报表、数据看板都太无聊了。加上规则系统总会出错,两层嵌套已经在逻辑上能绕晕一半人。因果推断所需要的思考和主观判断,在符合利益趋势的时候才会被重视吧。
  3. 强弱人工智能 个人最喜欢最后一章,虽然要读完了有点不舍,也有可能因为之前的内容或多或少在专业领域内,最后一章是作者个人主观见解和未来预期。而且还是Happy Ending未来预期,在五大问题里有四个作者给的答案都是Yes. Quite positive vibe. 此外是提到了迁移学习、自由意志是否存在的哲学问题和自我觉察。迁移学习已经不算新了,第一次接触的时候我因为还不不懂得考虑建模、训练、洗数据主要是洗数据成本而不明所以然。现在从架构上、算法上都非常appreciate迁移学习的应用if any. 自我觉察是有感于最近和Team Leader谈话,讨论某个技术方案,TL问这个技术的价值是什么,或者反过来想,没有这个技术影响是什么。现在建设模块的意义或者价值可以从假设没有这个模块的存在去想。自我觉察始于主动思考和反问。先让机器人觉察起来吧。至于自由意志的哲学讨论,因为问题太有趣了所以任何结论都可以接受。

阅读体验里还有一些非专业的有趣时刻,比如高尔顿板。童年时期公园里小商贩还允许自由摆摊的年代,有类似高尔顿板的弹珠游戏,不同区间对应不同奖励,小时候不懂概率分布,总觉得小贩用了吸铁石在底部试图左右结果。比如历史人物轶事,可能是科普读物的关系吧,写知识点的时候写到历史发展/历史人物,有一些能看出作者真的很可爱的小故事描述,比如某人出生在哪里读书在哪里爸爸是谁,哈哈哈没有时间的时候就会跳读。另外是书里的实例很新,比如alphaGo和柯洁、马航DNA检测,深度学习和它的困境。

2 有用
0 没用
为什么 为什么 8.7分

查看更多豆瓣高分好书

评论 0条

添加回应

为什么的更多书评

推荐为什么的豆列

了解更多图书信息

豆瓣
免费下载 iOS / Android 版客户端