人工智能 7.3分
读书笔记 第1页
FCperson

结构化地表述人工智能,从下往上依次是基础设施层、算法层、技术层、应用层。优质的人工智能企业,有的具有核心人工智能技术和能力,有的具有独特的场景行业优势。 ☞基础设施包括硬件 / 计算能力和大数据; ☞算法层包括各类机器学习算法、深度学习算法等; 本轮人工智能之所以能蓬勃发展,源于我们有了足够海量的数据、强大的计算资源以及更先进的算法。新一代的变化出现了重要的特征:基于大数据的深度学习。深度学习是从原始特征出发,自动学习高级特征组合,整个过程是端到端的,直接保证最终输出的是最优解。但中间的隐层是一个黑箱,我们并不知道机器提取出了什么特征。 ☞再往上是多个技术方向,图像、语音识别、自然语言处理等领域正在迅速产业化; 一个完整的语音处理系统,包括前端的信号处理、中间的语音语义识别和对话管理(更多涉及自然语言处理),以及后期的语音合成。在一些具体的场景下,比如语音搜索、语音翻译、机器朗读等,确实有用武之地。但真正做到像正常人类一样,与其他人流畅沟通、自由交流,还有待时日。 除了手持设备是近场交互外,其他许多场景——车载、智能家居等——都是远场环境。在远场环境下,声音传达到麦克风时会衰减得非常厉害,导致一些在近场环境下不值一提的问题被显著放大。这就需要前端处理技术能够克服噪声、混响、回声等问题,较好地实现远场拾音;同时,也需要更多远场环境下的训练数据,持续对模型进行优化,提升效果。 当前的语音技术在识别一个人所讲的内容时能够体现出较高的精度,当说话人数为两人或两人以上时,识别精度就会大打折扣。在这些任务上,研究者已经提出了一些方案,但还需要更多训练数据的积累、训练过程的打磨,逐渐取得突破,最终解决“鸡尾酒会问题”。 在当下,电子设备中的“屏幕操作”到“聊天界面”的转变已成大势。所有科技公司都在加速完成这种转变,争取下一代人工智能服务入口。 计算机视觉的研究方向,按技术难度的从易到难、商业化程度的从高到低,依次是处理、识别检测、分析理解。目前在处理和识别检测层面,机器的表现已经可以让人满意,但在理解层面,还有许多值得研究的地方。 图像处理以大量的训练数据为基础(例如通过有噪声和无噪声的图像配对),通过深度神经网络训练一个端到端的解决方案,有几种典型任务:去噪声、去模糊、超分辨率处理、滤镜处理等。运用到视频上,主要是对视频进行滤镜处理。这些技术目前已经相对成熟,在各类 P 图软件、视频处理软件中随处可见。 图像识别技术也已比较成熟,图像上的应用包括人脸检测识别、 OCR( Optical Character Recognition ,光学字符识别)等,准确率可以达到 99.5% ,从而使得在金融、安防等领域的广泛商业化应用成为可能。 图像理解本质上是图像与文本间的交互,可用来执行基于文本的图像搜索、图像描述生成、图像问答(给定图像和问题,输出答案)等。图像理解任务目前还没有取得非常成熟的结果,商业化场景也正在探索之中。计算机视觉已经达到了娱乐用、工具用的初级阶段。展望未来,计算机视觉有望进入自主理解、甚至分析决策的高级阶段,真正赋予机器“看”的能力,从而在智能家居、无人车等应用场景发挥更大的价值。 语义理解是自然语言处理中的最大难题,即使克服了语义理解上的困难,距离让机器显得不那么智障还是远远不够的,还需要在对话管理上有所突破。神经机器翻译在性能上确实取得了巨大突破,未来在出境游、商务会议、跨国交流等场景的应用前景十分可观。 现有的人工智能技术,一是依赖于大量高质量的训练数据,二是对长尾问题的处理效果不好,三是依赖于独立的、具体的应用场景,通用性很低。未来人工智能一个研究方向是从大数据到小数据,即如何在数据缺失的条件下进行训练,从无标注的数据里进行学习,或者自动模拟(生成)数据进行训练。其次是从大模型到小模型。目前深度学习的模型都非常大,动辄几百MB ,大的甚至可以到几GB 。虽然模型在 PC 端运算不成问题,但如果要在移动设备上使用就会非常麻烦。 ☞最顶层的是行业解决方案,目前比较成熟的包括金融、安防、交通、医疗、游戏等。 各国纷纷将 2020 年作为重要时间节点,希望届时实现自动驾驶汽车全面部署。按自动驾驶不同技术路线,传感器可分为激光雷达、传统雷达和摄像头三种。激光雷达是被当前自动驾驶企业采用比例最大的传感器类型。谷歌、百度、优步等公司的自动驾驶技术目前都依赖于它,这种设备安装在汽车的车顶上,能够用激光脉冲对周围环境进行距离检测,并结合软件绘制 3D 图,从而为自动驾驶汽车提供足够多的环境信息。激光雷达具有准确快速的识别能力,唯一缺点在于造价高昂(平均价格在 8 万美元一台),导致量产汽车中难以使用该技术。传统雷达和摄像头是传感器替代方案。 地图路线选择目前主要有两种:一是精致高清地图。这种地图往往配备在那些使用了激光雷达的厂商方案中,目的是为了创建 360° 的周围环境认知。二是特征映射地图。这种方案通常与雷达、摄像头的方案进行结合,可以通过地图捕捉车道标记、道路和交通标志。 车辆定位的方案也主要包括两种:一是通过高清地图。二是通过 GPS 定位。为了实现决策的安全性,需要达到厘米级的精确程度。 全球智能家居市场规模将在 2022 年达到 1220 亿美元, 2016 - 2022 年年均增长率预计为 14 %。已公布的国家数据表明,逾五成( 51 %)的用户表现出对智能家居的兴趣,与移动支付( 54 %)处于同一水平,远远超过可穿戴设备等其他选项( 33 %)。 我国智能家居市场规模 2016 年达到 605.7 亿元。从 2011 年开始,智能家居市场进入明显的快速发展阶段,到 2020 年,智能电视渗透率将达到 93% ,智能洗衣机、智能冰箱、智能空调的渗透率将分别增至45% 、 38% 和 55%。 从国际来看,亚马逊、苹果、谷歌等都争相在平台、系统中枢上布局,意在以开放平台为卖点,构建一个开放的生态,实现互联互通与家居控制中心的战略目标,借此抢占更多上下游的支持者资源,巩固自身在市场中的主导地位。 从我国情况看,当前智能家居市场的竞争格局逐渐明朗,市场上大致存在着四种竞争力量:第一种为传统的家电厂商,代表为美的、海尔等公司,在原有产品上进行智能化改造,并推出了相关智能家电产品和平台产品。第二种为互联网巨头公司,如 BAT 等,已经在软硬件、服务、内容等系列领域进行布局,并与传统家电厂商加强合作。第三种为手机硬件优秀企业,如华为、小米等。第四种为其他公司,如运营商、视频网站等。 而当前各个企业之间的技术标准并未实现互通和共享。产品不兼容影响用户购买选择,也增加了智能家居系统的铺设成本,这是目前智能家居产业发展的制约“瓶颈”之一。

0
《人工智能》的全部笔记 8篇
豆瓣
免费下载 iOS / Android 版客户端