AI 的研究方向与相关产品

点击图片均可跳转到对应网站。

逻辑型 AI

将程序对这个世界的认知以“特定情况下必须做什么”,以及它的目标通过数理逻辑的语言表达出来。程序通过逻辑判断不同情况下哪些动作是利于其目标实现的。

搜索

在大量的可能性中检索,例如 国际象棋中棋子的走法 或者 理论验证程序的推断结果。实践中人们不断有新的发现,使得相关程序可以在各个领域更有效率地完成搜索这件事情。

相关应用:AlphaGo — 人工智能围棋程序

Possibility analysis on board

我们创造了 AlphaGo,一个将先进的搜索树和深度神经网络相结合的计算机程序。这些神经网络将围棋棋盘的状况当作输入,并通过一系列包含数百万类神经元连接的不同网络层进行处理。

其中的一个神经网络,“策略网络”负责决定游戏的下一步。其他的神经网络,“价值网络”则负责预测游戏的赢家。我们让 AlphaGo 参与无数的业余棋局,借此帮助其增进对合理人类游戏的理解。然后我们让它跟不同版本的自己对弈数千次,每次都让它从自己犯下的错误中不断学习。

随着时间的推移,AlphaGo 不断进步并且越来越擅长于学习和决策。这一过程被称为“强化学习”。Alpha Go 在不同的全球性赛事中击败了围棋世界冠军,可以说是有史以来最伟大的围棋选手。

模式识别

通常程序被实现成,使用一种模式比较事物,以此作出观察。举例来说,人脸识别程序会在场景中通过匹配眼睛和鼻子形成的模式来找到一张脸。也有人在研究更复杂的模式,如在自然语言文本中,在国际象棋棋盘中或者在一些事件的历史中。

相关应用:Siri — Apple 的语音助手

Personalization within Siri UI

“嘿 Siri” 唤醒,识别之后的语音,进一步做搜索(使用关键词搜索并朗读结果),读取(查看日程,天气等),调用(结合“快捷指令”执行自定义操作,结合支持的App执行指定操作,如发微信给朋友)等功能。

表征

这个世界的一些事实总得用一些方法表示出来,通常人们采用的是数学逻辑的语言。

推断

从已知事实可以推断其他事实。在一些情况下,数理逻辑推导够用了,但 1970 年开始,非单调逻辑推断被引入。

最简单的非单调逻辑推理是,一般推理得出结论,但是当相反的证据出现以后,原有结论会被推翻。举例来说,当我们听到“鸟”,我们人会推断它可以飞翔,但当我们知道它是一只企鹅,这个结论就会被推翻。

基于共识知识库的推理

这是AI在距离“人类级别”走的最远的研究方向,从 1950 年开始。例如开发非单调逻辑推理系统 和 行动理论。

从经验中学习(机器学习)

基于联结主义和神经网络的AI研究方向。也有对如何使用逻辑表达定理的研究。程序只能学习可以形式化表示的事实或者行为,不幸的是,大多数的学习系统都受限于表示信息的能力。

相关应用:TensorFlow — Google 开源的机器学习平台

Four areas of machine learning

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
// QuickStart For beginners

import tensorflow as tf
mnist = tf.keras.datasets.mnist

(x_train, y_train),(x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

model = tf.keras.models.Sequential([
tf.keras.layers.Flatten(input_shape=(28, 28)),
tf.keras.layers.Dense(128, activation='relu'),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])

model.fit(x_train, y_train, epochs=5)
model.evaluate(x_test, y_test)

相关论文: 使用大规模无监督学习实现高级功能 — Google 学术

Most responsive stimuli on the test set for the cat neuron

训练的数据集是在 1000 万的 YouTube 视频中抽取的帧(视频中完整的一张图片)。为了避免重复,数据集只会从每个视频中采用一张图片。每个样本都是一张 200*200 像素的色彩图片。

整个训练在 2000 台机器上运行一周。

我们观察到 YouTube 数据集中最常见的事物是身体部位和宠物,因此很有可能网络也从中学习到这些概念。

规划

规划程序开始于了解世界的基本事实(特别是那些和动作带来的影响所关联的事实),特定情况下的事实以及声明的目标。基于这些事实,它们生成一个达成目标的策略。在大多数情况下,这个策略只是一系列动作的组合。

相关应用:自动驾驶

Waymo (前身 Google Self-Driving Car Project)

Autopilot screen of Waymo

发展历程:

  • 2009 Google 自动驾驶汽车项目启动,目标 不中断地自动驾驶 Toyota Prius 汽车行驶十段一百英里的路程
  • 车队增加 Lexus RX450h 车型,邀请 Google 员工在高速公路上进行早期测试。并且开始从零开始构建自己的传感器。 超过三十万英里的路程
  • 开始聚焦于复杂环境,研究如何在有行人、路障、信号灯和其他事物的城市接到中导航。 复杂的城市道路
  • 2015 探索 Firefly 车型可以实现的全自动驾驶。这些车有定制化的传感器、计算机、驾驶与刹车,没有方向盘和踏板。 盲人体验世界上首例完全自动驾驶,行驶在 Austin,TX 的公路上
  • 2016 成立为 Alphabet 集团下的 Waymo 公司,专注于自动驾驶技术。
  • 2017 与菲亚特克莱斯勒汽车(FCA)公司达成合作,将 Chrysler Pacifica Hybrid 小面包车加入车队。这是首个全部集成 Waymo 硬件套件,并且量产的车型。
  • 邀请 Phoenix, AZ 的居民参与自动驾驶项目的公开测试。 Waymo 初期驾驶项目启动
  • 全自动驾驶车辆开始在公路上行驶,车上没有驾驶员。
  • 2018 Waymo One 在 Phoenix 上线。
  • 2019 Waymo One 全自动驾驶逐步推广生产。

Tesla Autopilot AI

Tesla algorithms

  • 硬件
  • 神经网络
  • 自动化算法
  • 代码基础
  • 估值架构

相关应用:医疗专家系统

认识论

研究解决世界上问题所需的各种知识。

本体论

研究事物存在的本质。在AI这一领域,程序和语句涉及到各种事物,我们主要研究这些类型是什么以及它们的基本属性是什么。本体论的研究开始于 1990 年。

启发式

尝试从程序中发现新的事情或者受到启发。这个术语在 AI 领域中经常被提到。启发式方法 是指在搜索树中估计结点与目标之间距离的一种方法。 启发式断言 是指比较搜索树中两个结点哪个更好,即哪个结点离目标更近,可能更有用。

遗传规划

配对随机生成的 Lisp 程序,从数以百万计的迭代中选出最佳结果。开发团队为 John Koza,这里有个教程

Flowchart(Executional Steps) of Genetic Programming

相关项目: gpFlappyBird

Use genetic programming on FlappyBird game


相关链接