数学之美 (第二版) 8.9分
读书笔记 Google AK-47的设计者
Penn

追求完美未必是最好的,因为完美的方案一般都意味着巨大的成本。而先解决一部分问题或者核心问题,然后再一步步去迭代优化,最终达到完美,这样从总体上来看反而是更好,收益最大化。

在2002年, Google虽然支持对70种语言言的检索,但是所有的语言只有一个排名算法。当时的国际化工作仅仅局限于翻译界面和字符编码的适应。辛格找我来一起做一个全新的中、日、韩文搜索算法。说实话,我当时对特定语言的搜索不感兴趣,但是公司只有我一个学自然语言处理的中国人,而当时的中日韩搜索结果相比英文又很“烂”,这件事事便落到了我的头上。有了上次的经验,我这次也干脆直接用了个“简单”的方案。这个方法效果虽然很好,但是占用内存较多,当然Google的服务器数量还没有现在这么多,不可能为了中日韩这三个占总流量不到10%的语言额外增加一批服务器。辛格提出用一个拟合函数替代很耗内存的语言模型,这样不需要增加任何服务器。但是,这样一来搜索质量的提高幅度只有原来采用大模型时的80%。我又对此多少有点不甘心。辛格解释说,这样我们至少可以提早两个月将这个新算法提供给中国的用户,而且用户体验也会有质的提高,这是雪中送炭。我们暂时放弃掉的20%收益,对用户而言不过是锦上添花。我接受了他的建议在2003年初我发布了第一个专门为中日韩语言设计的搜索算法。一年后Google的的服务器数量也有所增加。我在模型压缩上也有了进步,这时便发布了完整的中日韩语言搜索算法。辛格这种做事情的哲学,即先帮助用户解决80%的问题,再慢慢解决剩下的20%问题,是在工业界成功的秘诀之一。许多失败并不是因为人不优秀,而是做事情的方法不对,一开始追求大而全的解决方案,之后长时间不能完成,最后不了了之。

0
《数学之美 (第二版)》的全部笔记 91篇
豆瓣
免费下载 iOS / Android 版客户端