07-062017

如何给AI赋予艺术创新的力量:Baidu Create 2017 | 让我们一起创造更多可能

中国交通广播网 百度AI开发者大会

1.AI 是中国的历史性机遇,中国有机会再次重塑世界。

2.Apollo(阿波罗)是汽车工业的安卓,又比安卓更加开放、能力更强!

3.Apollo 生态正式诞生,已拥有50余名初始合作伙伴。

4.DuerOS 将唤醒万物,是唯一能做到听清、听懂、满足的人机交互系统。

5.百度AI 平台最完整、最开放、最前沿,最有活力和生命力。百度给开发者提供超过60种强大的、可组合的AI能力。

6.AI 平台将让我们从互联网时代连接人与信息的世界,进入一个唤醒万物新世界。

7.开发者的成功才是百度真正的成功。


百度AI开发者大会先行预告片 | Baidu Create 201740秒带你直达AI新世界

过去一年,人工智能成为互联网及整个高科技领域最炙手可热的技术概念,AlphaGo引爆围棋人机大战、自动驾驶技术快速进入公开道路测试阶段、百度AI机器人小度挑战“最强大脑”成功问鼎,以及“人工智能”首次被写入政府工作报告,都促使越来越多的IT企业和开发人员投入到新一轮的技术大潮中。



       7月5日一早,李彦宏乘坐一辆基于Apollo 技术开发的自动驾驶汽车从百度大厦前往国家会议中心,实地演示了真实路况下的百度无人驾驶技术。本次百度AI 开发者大会的进程也随之徐徐展开。路上,李彦宏还和现场的陆奇进行了连线互动。


李彦宏乘坐无人车来到会场。


百度AI开发者大会(Baidu Create 2017)是全球首个专注于AI开发者的盛会,现场有近5000名开发者和生态合作伙伴出席。在此次大会上,百度宣布开放Apollo和DuerOS 两大平台和60项核心AI能力。李彦宏、陆奇在现场发表了演讲。



百度人工智能的整体布局


 
沉浸式体验:
 DuerOS 开放平台 



百度作为中国最具技术基因,也是最早布局AI技术的互联网公司,被公认为中国人工智能技术的领导者。在全球范围也与Google、Facebook、Amazon、微软等一起被视为AI领先集团的一员。联合50个初始合作伙伴,10家世界一流供应商和一流的芯片公司,百度的阿波罗生态未来将创造怎样的AI世界,也许正如百度集团总裁兼COO陆奇在开场演讲中说的那样“AI是百度的机会,百度将All-In AI。”

百度将All In AI”—— 陆奇(百度集团总裁兼首席运营官)


DuerOS体系架构图。


百度AI平台的架构。


百度AI平台开放的能力


亚马逊 “Alexa + Echo”的成功,几乎让业界所有人都看到 AI 民主化即将从语音技术开始爆发的可能,只是没有人确切知道是什么时候,由谁来完成。

而目前看来,其载体无疑将是智能语音助手,或者说是大部分人口中“智能音箱”。亚马逊已借助 “Alexa + Echo”撕开了市场切口,国内厂商在经过一段时间的酝酿后也纷纷跟进。


图丨亚马逊Alexa + Echo


反观百度开发了“DuerOS”,然后与硬件厂商合作打造产品。BAT在将语音交互技术产品化方面选择了两种不同的模式。

           百度DuerOS是基于人工智能的对话式第三代操作系统。作为一款开放式的操作系统,百度DuerOS可以应用于任何设备,让人们通过最自然的语音方式与设备进行交互,使设备具备与人类沟通和提供服务的能力。


搭载了百度DuerOS对话式人工智能操作系统的HTC U11手机

目前DuerOS已经具备7大类目70多项能力。自今年1月在美国拉斯维加斯CES大会上首次亮相以来,百度DuerOS已与中信国安广视、小鱼在家、海尔、联想、哈曼等众多知名企业达成合作,将DuerOS的对话能力广泛应用到手机、电视、音箱等智能家居、智能穿戴和车载等多个场景。今年3月,百度还发布了DuerOS智慧芯片,打通软、硬件能力,为行业伙伴提供一站式的人工智能解决方案,完善智能物联网生态。

目前,百度DuerOS已经具备语音唤醒、语音播报、应用控制、感情陪伴、链接3600行、索引全网信息、日程管理,7大类目,70+功能,旨在提供给用户更加高质量的生活体验,还可广泛适用于手机、智能家居、智能穿戴和车载等场景,并提供一站式解决方案,同时还支持第三方开发者的能力接入。

      陆奇的开场演讲之后,百度度秘事业部总经理景鲲上台,宣布了DuerOS 开放平台的全面开放。


“我们的目标就是要做Freestyle,让用户最自然地跟设备进行交互。”



DuerOS 开放平台全面开放10大类别100多项原生技能,内容与服务丰富优质,汇集最广泛的生态合作伙伴:硬件厂商、芯片厂商、模组方案商、内容商、开发者……

通过百度工程师罗兴的现场演示可以看到,依靠智能设备开放平台的便捷性,通过17行代码、仅用1分钟的时间,百度DuerOS 便成功接入搭载Alexa 的Anker 音箱,原本只会英文的音箱变得能够听懂中国话。
     点击下方视频看看一分钟之内发生了什么:



景鲲表示,“目前很多公司都在做智能音箱,而百度通过打造AI时代的安卓——DuerOS,让每个人,无论你是大公司还是小公司,甚至普通开发者,都能够以低门槛打造属于自己的智能语音交互设备。”


Kitt.AI是家怎样的公司?

自成立以来,Kitt.AI一直以致力于使人与自然语言理解技术的互动变得简单为核心方向。
      Kitt.AI专注语音唤醒和自然语音交互技术,是世界上唯一一家获得亚马逊Alexa和微软联合创始人Paul Allen投资的公司,并入选了CB Insights人工智能创业一百强。
      在过去两年中,我们Kitt.AI共开发了三款产品:Snowboy(可定制的词典检测引擎),NLU(多语言自然语言理解引擎)和ChatFlow(多圈谈话引擎)。


      根据官方发布的数据显示:2017年7月,Kitt.AI为Snowboy平台上的12000多名开发人员提供支持,该平台创建了世界上最大的热门图书馆,拥有15种主要语言的9000种独特的热门词汇。
      目前,Kitt.AI的产品部署在智能手机应用,扬声器,电器,网络聊天,汽车,家庭,会议室,办公室,医院甚至电话线。
      Kitt.AI联合创始人兼CEO姚旭晨本科毕业于南京大学,并于2014年在约翰霍普金斯大学获得计算机科学博士学位。随着百度全资收购KITT AI,姚旭晨也将加入百度。



中国“语音交互革命”正在无限接近消费者 | 百度大脑洞

景鲲在百度开发者大会现场宣布:百度将全资收购KITT.AI,把KITT.AI 的技术融入到百度平台中,全面、免费、正式地向百度的合作伙伴赋能开放。


KITT.AI专注语音唤醒和自然语音交互技术,是唯一一家获得亚马逊Alexa和微软Paul Allen投资的公司,并入选了CB Insights 人工智能创业一百强。


有了这个开放平台,一个工程师舅舅借用DuerOS 智慧芯片让外甥的乐高玩具学会了说话:



      百度在两年半以前就开始布局AI相关产业,同时下了很大力气将现有搜索转化为服务,通过把语音转为文字,再更进一步转化为后端需求。如果一家搜索公司做类似的事情,还是有优势的。一个典型的例子就是从 Google 到 Google Home,从回答问题,到对内容的理解、服务的覆盖能形成一个良性循环。百度在战略和思路上已经把人工智能放在了公司的首要地位,而且步伐比较明晰,短期产品、中期规划、长期愿景都已经铺开。百度相信人工智能被市场认可和接受只是时间问题。


 
 阿波罗开放平台:无人车现场试驾 



        1962年,美国总统肯尼迪曾对“Project Apollo(阿波罗计划)”说过这样一段话:

Well, space is there, and we're going to climb it, and the moon and the planets are there, and new hopes for knowledge and peace are there. And, therefore, as we set sail we ask God's blessing on the most hazardous and dangerous and greatest adventure on which man has ever embarked.
       因此,太空就在那儿,而我们将要登上它,月球和其他行星在那儿,获得知识与和平的新希望在那儿。因此,当我们启程的时候,我们祈求上帝保佑这个人类有史以来所从事的最危险和最伟大的冒险。

       自此以后,“Apollo”这个词就被赋予了非凡的意义:

具备开创性,又需要汇聚众多参与者的力量,能为社会发展带来巨大推动力的超级工程。百度相信自动驾驶和智能汽车也是这样的事业。


2015年12月,百度无人车登上央视《新闻联播》,李彦宏接受央视采访。


 2015年12月,2015年互联网大会,习大大点赞百度无人车


李彦宏现场讲解了百度无人驾驶车的技术储备、路测实况、行业突破等内容。习近平主席饶有兴趣地观察着面前这辆前不久成功路测的无人驾驶车,并发起一连串专业提问:技术的自主研发程度如何、时速能达到多少、成本怎么样、什么时候能实现大规模商用。习主席原定在百度展台停留3分钟,最终停留了10分46秒。


2016年9月,百度拿到美国无人驾驶测试牌照。

2016年9月1日,百度无人车获得了美国加州发布的无人驾驶路测牌照,获准在美国进行上路测试。

作为牌照发行方,加州DMV(车管所)也第一时间更新了这一信息。如图所示,在这些已经获得许可的15家公司里,有一些是我们耳熟能详的,如大众、奔驰等;也有一些是大家相对陌生的,如Zoox和Drive.ai等。



图片信息来自加州DMV官网。


      今年4月,百度发布了
阿波罗计划,宣布将成熟的自动驾驶技术进行分享:奇瑞、一汽、英伟达、TomTom 等多家企业将以生态合作伙伴身份出席目的是向汽车行业以及自动驾驶领域提供新的软件平台。它包含了一套完整的软硬件和服务体系,主要有车辆平台、硬件平台、软件平台和云端数据四个大部分。而这次在开发者大会上,陆奇直接发布了阿波罗开放平台,并对大家承诺了到2020年的开放计划。




 Apollo 详细开放计划 


百度将开放环境感知、路径规划、车辆控制、车载操作系统等功能的代码或能力,并且提供完整的开发测试工具。百度今天正式对外开放的是Apollo 1.0。这是一个重要的里程碑。百度开放了封闭场地循迹自动驾驶能力、自定位能力和端到端等非常有价值的数据。更为重要的是,Apollo 会快速地开放越来越多的能力,每周都会更新,每两个月左右都有新的版本和总体能力的提升。


▲ 百度集团总裁兼首席运营官陆奇


百度集团总裁兼首席运营官陆奇表示:“中国作为全球最大的汽车生产和销售市场,汽车品牌众多,合作环境更加开放。百度这次主动开放自动驾驶技术,将与汽车行业碰撞出非常多的创新机会,能更广泛地释放我们技术积累的价值,带动行业快速变革。而放眼美国及其他汽车产业较为发达的市场,百度所倡导的开放创新的行业生态,也将对自动驾驶的加速发展起到促进作用。” 



       接下来百度
Apollo 的具体计划是:

到今年9月份,Apollo 将会开放固定车道自动驾驶能力和开放部分仿真数据;

到今年年底,Apollo 将开放一系列的能力,使车辆能够在简单城市路况下,完成自动驾驶任务,同时会开放更多的仿真数据及数据上传的接口;

2018-2020年,Apollo 会持续开放,加速创新速度,直到最后实现完全自动无人驾驶。

有了阿波罗计划和阿波罗团队的技术支持, 国外开发者Joshua Whitley 仅用了三天时间,就把自己的车改装成了自动驾驶的循迹车。


一,推出“AI Star计划。在3年内帮助培养10万名AI工程师人才,通过资金、培训、市场、政策等配套措施,为AI开发者提供全方位的扶持。

二,举行第13百度之星大赛。百度之星在中国科技行业极具影响力,历届大赛参赛学生数累计已超过20万。今年大赛将以 “Create for more (岂止创造)为主题,在传统的程序设计大赛上新增开发者大赛,让更多开发者能有机会参与进来,用最强、最好的AI能力来做创新。

三,携手长江产业基金助力开发者成功,成立Apollo基金和DuerOS基金,推动中国AI的发展。


       1,NVIDIA
方面:百度与之达成的合作领域包括四个方面:在Apollo上合作开发自动驾驶技术,NVIDIA将提供Apollo的参考计算硬件;在PaddlePaddle 深度学习平台上,NVIDIA将专门投入研发团队使PaddlePaddle将来成为中国最强的深度学习平台;在DuerOS 和百度智能云上,NVIDIA做深度的合作为开发者提供更好的GPU支持。
 

2,英特尔方面:英特尔AI产品集团CTO Amir Khosrowsashi介绍,百度和英特尔已经进行了十年的合作,主要有三个合作方面:百度大脑;百度智能云;DuerOS。双方的合作将让英特尔在中国有更大的发展空间,百度也将得到更好的结果。Amir表示,英特尔非常重视中国的开发者。今天大会的宗旨是为开发者创造,英特尔也是如此。




 李彦宏:
AI 时代,开发者迎来了真正改变世界的新机遇 


乘坐自动驾驶汽车由百度大厦到达国家会议中心之后,李彦宏在现场做了今天大会的主题演讲:

PC 互联网时代的开发者,都有点像西部牛仔里面的孤胆英雄,一个人几条枪就可以震惊世界。

移动时代,开发者群体被埋没了。

AI 时代,开发者迎来了真正改变世界的新机遇,但另一方面,PC 互联网时代那样的个人英雄主义不再可行。不是现在开发者的技术能力不及从前,而是AI技术,是算法和数据两轮驱动的,没有人可以通过一己之力,完成一套语音、图像、自动驾驶等的研发。人工智能对数据的天然需求,决定了AI 的开发者一定要形成协作的生态,通过开放的数据、共享的代码、以及群体协作的精神,让AI技术的能力越来越强,应用的前景越来越广阔。 


 Sony CSL实验室《Daddy’s Car》


       比如:人工智能在作曲方面已经有了相关尝试,但还停留在风格模仿的阶段,复杂的编曲也还需要人类作曲家来“助攻”。

       这首披头士风格的《Daddy’s Car》由Sony CSL实验室AI所做,其同胞兄弟是一首黑暗爵士风格的《Mr Shadow》。这张AI专辑背后的技术是Flowmachines,可以配合深度学习曲库中的乐曲风格,再配合索尼研发的风格变换、优化和交互技术进行歌曲的处理。因此这个程序可以编出各种风格曲目。

Google人工智能90秒钢琴曲。


       去年,Google也用人工智能技术写了一首长达90秒的钢琴曲,在基础旋律上加入和旋和变奏,但更为复杂的编曲还得依赖于人类后续编改。此项目运用机器深度学习大量的音乐片段,然后给它一些简短的提示让其自行创作出音乐片段出来。虽然机器作曲家目前还不完美,音乐全套创作仍需人工参与,但Google的科学家认为,如果艺术家与机器学习模型平台一旦被建立完善,机器创作将会触手可得

▲ 百度创始人兼首席执行官李彦宏在百度AI开发者大会上发表演讲


AI面前,文学会是人类最后一片情感领地吗? | 百度大脑洞

2014年3月17日,美国洛杉矶发生4.4级地震的时候,《洛杉矶时报》对地震的相关报道就是由其编辑部的机器人写作和发布的。据媒体报道,该新闻从撰写到发布仅用3分钟,除了能够应对地震等突发新闻之外,还有专门快速写作犯罪新闻的机器人系统。


2015年9月10日,腾讯财经尝试启用写稿机器人“Dream writer”,发表了一篇关于8月份CPI的稿件。

2015年11月7日,新华社的机器人新“员工”———“快笔小新”开始正式入职。据介绍,“快笔小新”供职于新华社体育部、经济信息部和中国证券报,可以写体育赛事的中英文稿件和财经信息稿件。


 新华社技术实验室人员在讨论完善机器人写稿流程。


2017年3月24日,比尔·盖茨在北大直播演讲,主题为“中国的未来:创新、慈善与全球领导力”。演讲中,除了提及互联网公司,他还出人意料地提到了传统媒体《钱江晚报》。

比尔·盖茨之所以提到《钱江晚报》,是因为微软与《钱江晚报》在“人工智能+新闻”领域共同推进探索,双方共同打造国内首个机器人记者“小冰”。
       初期的合作模式是将小冰植入《钱江晚报》的微信矩阵,发挥她善于聊天的功能,将订阅号从传统人工回复粉丝留言的模式进化成人工智能回复模式。同时,小冰团队为《钱江晚报》优先开放了测颜值、测关系、读心术等有趣的人工智能小应用,升级了微信号的活动玩法。你可以这样认为,小冰是一位新来的客服——她自带流量,她受年轻人追捧,她还可以24小时随时在线。


今年5月,100%由人工智能生成的诗作《阳光失了玻璃窗》,集结成册传到读者手中,这样的画面颇具科幻意味。这本诗集所包含的139首现代诗,全出自微软机器人“小冰”之手。

当AI有了情感,便创作了诗集《阳光失了玻璃窗》。



我迷失了我所有的欢乐
我有金锦绣在阳光
不能喊出我自己的欢乐
我不在小时候
灵魂之泪在命运之前的灰色
在梦里的光
我迷失了我所有的欢乐
我听到了人类的命运之足下飞舞
不见世界只剩愚了他们的厚意
——微软小冰

━━━━━

 真爱 | 刚刚出版了诗集的微软小冰出单曲


微软互联网工程院高级产品经理周典表示,“(小冰)在学习了更多的曲风(尤其是民歌唱法之后),我们可以听出来,模型升级之后,(小冰)不但发音吐字上面更清晰、更流畅了,并且它对于民歌的这种转音的唱法也非常娴熟。我们又借鉴了小草(朱主爱)的一些经验,在近期的模型上,对它在情感化演绎上面做了一些优化,尤其是结合了我们的情感计算框架。”


百度度秘事业部成立美国硅谷团队 全球招揽人才。


百度与微软相恋,这场战略合作到底能走多远?如果本就不重韵律的现代诗创作让你觉得有些“投机”意味,那么AI的古诗写作或许可以稍稍修正一些你的看法。以目前百度的度秘APP以及手机百度APP为例,它们均搭载了“为你写诗”功能,给出你想要的关键词,即可快速得到一首由AI创作的命题古诗:


以擅长创作古诗的度秘来说,它的创作过程充满了理性的统计和运算百度度秘首创诗歌规划模型,根据一个关键词,“联想”出主题,进而创新作出诗句。度秘的作品因此拥有人类的情感和意境。依托大数据与机器学习,度秘分析整合古诗词的韵脚和语境,重新生成新的诗句,甚至还能写出“藏头诗”


需要重点介绍的是,度秘的创作过程不同以往

首先,我们不限制用户的输入。它可以是一些关键词、短语、句子甚至文档。以前的方法只能支持一些关键词或必须提供诗的第一行。

其次,我们会根据用户的输入确定这首诗的主题,每一行都有一个特定的子主题,保证生成的诗是连贯的、有条理的。而之前的方法基本上只能够保证第一行是符合用户意图的,下一行可能就会文不对题。

第三,节奏和语调控制方面,我们的模型可以自动地从训练语料中学习约束。

最后,我们的诗歌生成模型较之其他方法,拥有更简单的结构。



百度度秘所采用的模型 Chinese Poetry Generation with Planning based Neural Network

不需要专家知识,是一个端到端的模型。它试图模仿人类开始写作前,先规划一个写作大纲的过程。整个诗歌生成框架由两部分组成:规划模型和生成模型

规划模型:将代表用户写作意图的 Query 作为输入,生成一个写作大纲。写作大纲是一个由主题词组成的序列,第 i 个主题词代表第 i 句的主题。

生成模型:基于 encoder-decoder 框架。有两个 encoder, 其中一个 encoder 将主题词作为输入,另外一个 encoder 将历史生成的句子拼在一起作为输入,由 decoder 生成下一句话。decoder 生成的时候,利用 Attention 机制,对主题词和历史生成内容的向量一起做打分,由模型来决定生成的过程中各部分的重要性。

知道度秘是怎么写诗的?点击下方视频可以快速了解:



关于AI终究难以逾越文学创作的症结何在,知名作家马伯庸的一段话似乎可以很好地解答:


文学最大的价值在于朦胧感、在于隐晦、在于隔靴搔痒,我举一个文学著作《金瓶梅》的例子:《金瓶梅》里面有一段描述潘金莲与武松对话:潘金莲说:你若有心,吃我这半盏儿残酒。这句话表面看非常平常,但是蕴含的隐晦意味是 AI 很难模拟出来。
      5月中旬,在中国当代文学南京论坛上,多名作家围谈人工智能对文学的影响。在作家韩少功看来,人拥有千差万别的契悟、直觉、意会、灵感、下意识、跳跃性思维,一旦面对实际生活的千变万化,如何创造出新的审美和价值,超越成规俗见,目前可能是人工智能无法逾越的障碍。



古人因为空间阻隔,不能相互沟通,不能共享成果、推动应用,而不得不一遍又一遍的重新发明轮子。如果在AI时代,我们还是去封闭地造着别人早已造出来的轮子,甚至因为看到了别人在做新技术,自己就再去做一遍,那一定会被时代淘汰。在更加依赖协作和共享的AI 时代,单兵作战、重复发明轮子也跟不上技术发展的进程。

AI 不仅是互联网发展的下一幕,也是通往未来的必由之路,而开放则能让所有人都收获更多,让所有人都能到达梦想的彼岸。怎样能让所有人都收获更多?那就是我们以最开放的态度,把我们的最核心技术能力共享出来。



       一路惊喜着看完了上午的主论坛,点击下方视频,先跟着镜头逛逛会场,下午六大分论坛的精彩内容在视频后。



 
Baidu Create 2017:精彩纷呈的六大分论坛 



下午的六个不同主题的分论坛同样精彩,它们分别是:


聚焦AI基础技术

主题:开放创新 共襄AI未来

对话式操作系统

主题:智语世界 创领未来

智能驾驶

主题:星罗云布 共享Apollo

智能云

主题:智能计算 智慧共享

Web生态

主题:共襄Web繁荣

数据中心技术

主题:超凡动力 赋能AI



 01、聚焦AI基础技术 



        此次,百度多年打造的完整AI技术平台将全面开放。

百度的AI能力分为4层:在基础层,是AI算法、大数据、大计算能力。感知层,包括语音、图像、视频、AR/VR等技术。认知层,有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度AI开放平台ai.baidu.com开放,与开发者共享。开放的技术能力总共有60个,是最全面的AI技术开放平台。


语音技术+自然语言处理可以让机器听清、听懂、满足用户需求,视频分析、人脸识别和增强现实技术让机器“看懂世界”,除了发布新开放的核心技术能力,百度杰出科学家徐伟批露了PaddlePaddle 的发展路径,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个深度学习开放平台,PaddlePaddle将与开发者一起繁荣AI生态,引领行业发展。


━━━━━

 业界 | 百度开源新一代深度学习硬件测试工具:DeepBench 


2016 年 9 月,百度推出了第一版 DeepBench,它是一个开源基准测试工具,用于测试训练深度学习神经网络的基本性能指标,可兼容不同硬件平台上的神经网络库。

通过测试深度学习任务的运行速度,DeepBench 可以帮助开发人员选择最优的硬件配置。此外,DeepBench 也是向硬件供应商提供交流机会的平台。这次,DeepBench 的测试结果中加入了三种新的英伟达 GPU:TitanXp、1080Ti 和 P100。由于广受欢迎,DeepBench 正在成为深度学习和新硬件开发的标准之一。

6月29日,百度研究院开源了新一代 DeepBench,这次升级加入了推理测量等功能。

 AR 技术可以把你的iPhone 镜头瞬间变成一把精准的量尺 


自从苹果推出ARKit 以来,不少开发者都开始用它来发挥自己的想象力。

日前,Laan Labs 发布了一款名为AR Measure 的App,利用AR技术,它可以把你的镜头瞬间变成一把量尺。在Laan Labs 公布的一段视频中可以看到,这个“AR卷尺”的精度已经和真实的尺子相差无几,而且还可以无限延伸。这款APP将于今年秋季登陆iOS11。

 強い | 百度Simeji语音输入功能上线,日本人民也可以用“嘴”打字了!


6月15日,百度日本宣布,旗下Simeji日文输入法发布语音输入功能,安卓端率先上线,iOS端也在筹备过程中。至此,Simeji成为日本唯一支持语音输入的输入法。

现在,用户只需打开Simeji,长按话筒并对准手机麦克风说话, Simeji即可高效、准确呈现文字内容,解放用户双手,增强互动体验。更为独特的是,除文字内容之外,Simeji还提供与输入内容对应的颜文字选项,用户可根据喜好在文本和颜文字间任意切换。



 02、对话式操作系统 

 “唤醒万物”的核心三要素: “听清、听懂、满足” 



        听清
:在AI时代,我们希望把语音放到真正的场景里面,麦克风阵列、回声消除、语音唤醒等,都是我们逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求;

听懂:数据多、技术深是打造对话系统的必然条件,百度是具备数据量最大的公司,我们有百亿的支持、十亿的图谱。在AI时代,要做到听懂用户,实时图谱数据的力量将是一个非常重要的支撑;


▲男女主人公在这里合唱了《City of Stars》。


满足:听懂并满足“听一首歌”这样的用户需求还不够,真正用户想要的是复杂得多的需求,比如“电影《爱乐之城》里女主角第一次和男主角跳舞得歌曲是什么”,只有把用户在真实场景中表达的复杂请求做好,才能真正满足用户自由的表达、满足他们的需求。

沉浸式体验DuerOS智能家居体验馆


DuerOS 将为开发者提供最容易上手的软硬件一体化方案,包括多样化的开发套件和完全开放的参考设计:

1、搭载树莓派的个人版。即刻申请就可以搭载一个个人可以对话的语音设备。

2、轻量版。把一元钱大小的芯片放在任何一个设备里面,设备就可以对话。

3、标准版。两麦、四麦、八麦的标准版都可以即刻申请。

4、一体化完整设计的参考设计。如开放的链路设计、开放的音响设计等等。



03、智能驾驶 

Apollo 开放平台完整的技术架构包括软件平台、云端服务平台、参考硬件平台、参考车辆平台四大部分,通过四层架构全方位构建能够实际运行的自动驾驶系统,并将通过开放代码、开放能力和开放数据三种形式逐步赋能开发者及生态合作伙伴。



Apollo 的核心技术平台 




      一、中间是软件平台。
Apollo 开放了一系列重要模块,重点是以下四大模块。

1、自定位模块:使用百度业内领先的高精地图,加上多种传感器融合,让每一辆车都可以低成本、全天候地精准定位。

2、感知模块:感知是当前自动驾驶工业创新的重点,运用顶尖的人工智能技术能看清和看懂路况,包括每一个障碍物、行人、车辆。

3、车辆规划控制:Apollo 模型运用AI和大数据,采取最安全的驾驶策略做到精确的车辆控制,也能适应不同国家的交通路况。

4、运行框架:这是Apollo 的基石。核心是安全、可靠、实时控制,并能同时支持Intel和NVIDIA的芯片。


Apollo技术框架


二、上面是服务平台。Apollo 一系列重要的开放能力都汇聚于此。重点包括:

1、高精地图服务,这是自动驾驶的千里眼。

2、仿真引擎。百度在快速累积海量的数据,能让开发者日行百万公里。

3、安全服务。百度将给开发者持续提供高度的安全服务。

4、DuerOS 服务:为每一辆车提供智能化的车内体验。


三、参考硬件平台和参考车辆平台。

Apollo 硬件平台支持从CPU 到GPU 到FPGA 各种计算硬件,也支持从GPS、IMU、摄像头,到激光雷达等各种传感器。同时,Apollo 提供的黑盒子能够记录和保存所有的数据信号,使得合作伙伴可以更安全、有效地预防和处理车辆事故。



“青海长云暗雪山,孤城遥望玉门关。黄沙百战穿金甲,不破楼兰终不还。”
        无人驾驶,作为战略意义的“天王山”,同时控制全球人工智能、智能汽车、共享出行、快递物流和车联网等近百万亿产值市场的制高点。任何国家,一旦在这场产业大战中失利,将从21世纪大国队伍中被淘汰出局。尚留在舞台上争雄的,只剩下美国、中国、德国、日本。
        全球范围内无人驾驶生态的合纵连横在高速推进,全球无人驾驶产业链的“热战”正在全面爆发。对无人驾驶产业主导权的争夺,已从原有的单打独斗,逐步过渡到以国家力量为后盾的产业生态鏖战。

2017年7月5日,百度集团总裁兼首席运营官陆奇发布百度Apollo开放平台。(新华社记者 申宏/图)


任何企业,没有在生态系统中找到自身定位、在产业分工体系里占据有利地形,将被赶出竞争舞台。
      中国AI巨头百度,继宣布了无人驾驶的apollo计划后,再次放出大招。这次他没有固守老巢等待谷歌联盟的扣关,而是主动出击海外市场,联手全球第一大和第二大汽车零部件以及ADAS巨头,组建全球最大的无人驾驶产业生态,其问鼎全球无人驾驶产业的雄心和决心昭然若揭。
      
目前Apollo 生态合作伙伴联盟已辐射OEM、Tier1、地图公司、芯片公司、基金投资、个人开发者、创业公司、研究机构及政府机构等,成为全球涵盖产业最为丰富、最为全面的自动驾驶生态。



 04、智能云 


百度云作为A(人工智能)B(大数据)C(云计算)三位一体的智能开发平台,具有更易学、易用、易推广的特性。通过几次简单的鼠标点击,开发者即可在百度云上快速创建属于自己的深度学习实验室。

会上,百度推出针对于AI开发者的扶持计划:“AI Star计划”,该计划总价值1亿元人民币。通过百度云计算资源及生态资源支持等多方面的支持,促进AI开发者快速场景化应用。其中计算资源直接支持1万个AI开发者(单个礼包价值5000元),通过百度双创中心、百度资本、百度风投等AI创新项目扶持资金5000万,3年内通过百度云智学院、百度技术学院为全球培养10万名AI工程师人才

目前,百度云的8+ 智能服务、20+ AI服务接口,以及百度大脑能力已经向开发者全面开放。

大数据平台、深度学习平台、数据采集和标注平台、百度效率云平台、百度MTC云测平台,这五大平台也将持续为AI 开发者输出更多的技术支持。

━━━━━



 业界 | AI模拟人脑新破:新型人造突触研究已公布 


人类神经系统由数百万亿的神经突触组成,这样的结构允许神经元通过电信号和化学信号传递信息。为了开发地模拟人类学习、感知和图像识别的AI系统,研究人员在实验室中用电子元件模拟神经突触。但目前大多数人工神经突触只能传递一种信号类型。

近日,一篇刊登在《ACS Nano》期刊上的文章称,一个课题组开发出模仿人类神经系统基本功能的人造突触,它能够从同一前突触末端释放抑制和刺激信号,它允许装置在兴奋和抑制信号中切换。




 05、Web生态 

在移动互联网时代,用户开始习惯通过一个一个独立的APP去解决自己遇到的问题,但APP也存在诸如占用空间大、下载使用成本高等问题。基于此,谷歌、百度等搜索引擎开始积极推进PWA(Progressive Web App),希望可以让用户在Web生态里获得更加简单便捷并且不逊于APP的体验。

为了更好地帮助开发者去搭建PWA应用,百度在此次开发者大会Web 分论坛上正式发布了Lavas 解决方案,这是一个基于Vue的PWA 解决方案,包括工具、文档,以及对应的解决方案和建站模版。Lavas 是一个开源的解决方案,百度希望国内的开发者也能多多参与到这个项目中,共同建设和改善国内的Web App生态。



 06、数据中心技术 


会上,百度系统部高级总监刘超首先发布了百度最新的XDN计划,将覆盖全球的接入网络赋予更强大的计算能力,对图像识别加速、语音识别加速、无人车等 AI 应用提供更好的支持,进一步提升了用户体验。他表示百度基础网络通过25G服务器接入部署、GPU 100G+RDMA 方案等一系列技术升级,将数据中心单集群规模提升到5万台服务器以上,从而促进人工智能和大数据应用的快速迭代。

百度X-Man2.0 GPU Box服务器。


现场发布的另一款产品是百度最新的研发成果——百度定制FPGA和X-Man2.0 GPU Box服务器。定制FPGA 实现10倍性能提升和超大规模部署;X-Man2.0支持液冷设计散热效能提升45%,NVLink2.0带宽提升1倍,CPU和GPU 硬件解耦按需动态配比。


百度希望通过这次大会,能为所有的开发者提供更便捷开放的平台,能让大家不受数据限制、“不重复造车轮”,充分发挥自己的能力和想象力为AI时代助力。正如李彦宏所说,这是开发者的黄金岁月,开放能创造最好的时代。

━━━━━


 外媒评选20位中国AI领袖,“百度系”占了一半。 

近日,《Forbes》刊登了一篇文章《These 20 Leading Technologists Are Driving China's AI Revolution》,AI领域知名科技媒体TOPBOTS评选出了20位驱动中国人工智能改革的科技领导者。文中提到,2017年AI研究热潮全面展开,美国、中国、加拿大、日本等陆续将AI研发列入国家战略规划并已投入巨大资金与力量开展AI领域的研究和实施人才战略。麦肯锡的一份公开研究显示,在人工智能学术研究领域中国全球领先,仅在2015年就发表了近1万篇论文。入选名单中,陆奇、王海峰、林元庆、景鲲、徐伟、Adam Coats、吴华这7位来自百度。再加上之前从百度“毕业”的王劲、余凯、张潼,“百度系”堪称占据了中国AI的半壁江山。

━━━━━


 AI Fintech | 百度携手农行共建智能银行 


6月20日,中国农业银行与百度战略合作签约仪式在北京举行。百度董事长兼CEO李彦宏、中国农业银行董事长周慕冰、百度高级副总裁朱光、中国农业银行副行长郭宁宁等双方高管出席签约仪式,并为双方共建的“金融科技联合实验室”进行揭牌。

百度则拥有全球最领先的人工智能技术。金融作为人工智能最重要的应用领域,双方通过AI Fintech的联合创新,将推动银行业进入智能金融时代。按照双方战略合作协议,这次的合作主要围绕金融科技领域开展,包括共建金融大脑以及客户画像、精准营销、客户信用评价、风险监控、智能投顾、智能客服等方向的具体应用,并将围绕金融产品和渠道用户等领域展开全面合作。