人工智能深度学习的挑战

万宝龙 · 发表于 2017-6-2 18:12

马上注册，享用更多功能，让你轻松玩转本论坛。

您需要登录才可以下载或查看，没有账号？立即注册

×

　深度学习的挑战

深度学习也面临挑战

　　但是深度学习以及机器学习还面临很多挑战。这里有几个问题。

　　第一个问题，就是我刚刚提到的：目前仍然没有一个统一的平台。在深度学习方面，现在的人懂就是懂，不懂就是不懂。这就是为什么Google最近花了重金不断在挖业界顶尖的人才，给年轻人开出的年薪甚至超过200万美元。这些人也就是二十来岁，博士刚毕业不久，怎么会这么值钱呢？

　　其实就是因为两个理由，第一，这些人进入了公司之后，会被投入到健康、医疗、预防等等各个领域的研究。他们虽然每年拿走公司的两百万美金年薪，但是也许两年后他们就能在相关领域创造出两亿美金的价值，所以对Google公司而言，这些人才实际上不贵，是非常划算的。

　　第二个理由就是Google多雇一个，Facebook就得少雇一个。这不是开玩笑。因为在美国有三个大公司在疯狂挖人工智能的人才——Google、Facebook和Microsoft，他们之间竞争激烈，对人才的吸引力也不相上下。

　　第二就是深度学习的网络太大，需要海量的数据。

　　第三，因为数据太多，所以计算特别的慢，所以需要非常大的计算量。

　　第四点有点奇怪但也合理：机器无法用人的语言告知做事的动机和理由。即便机器训练做了很棒的深度学习，人脸识别、语音识别做的非常棒，但它不能和人一样，它讲不出来这是怎么做到的。虽然有人也在做这方面的研究，但是在今天，如果一个领域是不断需要告诉别人该怎么做，需要向别人去解释为什么的，那这个领域对于深度学习来讲还是比较困难的。比如AlphaGo打败李世石，你要问AlphaGo是为什么走这步棋，它是答不上来的。

　　即便有如此多的局限，我们还是认为人工智能在很多领域可以迅速应用，并且可以帮助企业打造竞争壁垒。

　　人工智能如何帮企业打造竞争壁垒？可以从如下四个方面思考：

　　第一，如果你有垄断性的大数据，你就会有很大的优势。关于数据需要注意的几点是，首先垄断性大数据不是公开的数据，不是剽来的数据，也不是买来的数据，因为这样的事情你能做竞争对手也能做。其次，无标签的数据也不会给你带来优势。再次，如果是人工标签的数据也不行，因为人工标签太慢了。最好的数据是闭环的数据，所谓闭环的数据就是在你应用的时候可以捕捉到数据并且知道最终你根据数据做出的抉择对或不对。我们投资的face++，它有和美图、阿里的合作，就一定程度形成了特别大的数据的优势。

　　第二，拥有庞大的机群。机群是很重要的，包括需要什么处理系统的支持，怎么去部署，用什么样的计算架构等等。

　　第三，你要有一批特别懂的人。没有平台的时候，你就只能把一批人丢进去，让他们去解决特别大的问题。

　　第四，当你没有平台的时候怎么办？我们就可以找一批特别聪明的人，让他们不断的调节算法——当然这构成一个短期的竞争优势，从长期看，一旦大的人工智能平台出来，这种优势就不存在了。所以现在来做人工智能，抓到这个先机是特别特别重要的。

　　人工智能如何快速商业化？

人工智能如何快速商业化

　　第一，不要用人工智能去取代人。

　　机器不一定要取代人，很多情况之下他只要能辅助人就可以了。我谈到了很多工作会消失，但医生会全部失业吗？一定不会，应该是最高明的医生创造很多机器人给他人使用。记者就不再需要了吗？写深度文章还是需要的，但简单拼拼凑凑的文字就不需要了。所以这些工具一定程度上是在辅助人而不是取代人。

　　第二，要聪明的找到容错的用户界面。

　　想想搜索引擎，搜索引擎的精确度其实是很低的，你想一想，当你去百度，Google搜索的时候，它们给出的第一条就是你要的答案的情况有多少？我估计不会超过50%，但是为什么我们都说搜索引擎聪明，不说他笨呢？第一个理由当然是因为它博学，第二个则是因为它的界面做的非常的聪明：它给用户提供很多结果，而用户只要能找到他满意的那个，就会认为搜索引擎很棒，因为没有它的话，用户可能什么也找不到。这一类的容错的界面，即便它的识别率很低，给你很多结果，让你在一定时间里得到满足，其实还是达到了一定的可用度。

　　第三，让用户提供自然的大数据。

　　当Siri推出的时候很多人都说“这就是个玩具而已”，认为它没有真实的用处，但是苹果靠Siri收集了很多人的真实语音，收集了大量数据。

　　很多人把Siri当成一个搞笑工具，会问它诸如“你是男是女”这种无聊问题，苹果就把这些无聊的问题深度分析了一下，去了解人们最常问的都是什么问题，然后他们就考虑能不能优化Siri，让它对正常问题的解答能让人们在一定程度上得到满足。人们满足了以后，就会继续的问，如此问题越问越多，苹果也就可以得到更多的数据。

　　苹果的这种数据收集方法非常聪明，值得借鉴。我们以前在学语音对话的时候，问的都是非常正经的问题，到最后分析来分析去，不过是那固定的几万句，一直没有跳出这个框框，得到的结果也就不会让人满意。但用一种有趣的方式，你就可以像草船借箭一样，去“借”到几亿个数据。这些数据哪怕不精确也无妨，因为整体来说深度学习非常聪明，能把那些不精确不精准的东西忽略掉。

　　第四，关注局限领域。

　　Google很伟大，它要做全天候全路况的无人驾驶，它想把全部竞争对手都击败，最后就剩一个Google。这个计划很宏伟，但是是不是一定要这么做呢？我觉得不见得。其实我们完全可以先做一个用于局限领域的无人车，把这样的一个产品先做起来，然后我们通过它获取数据，学习教训，不断改进。

　　想想无人驾驶叉车。这个叉车是产生价值的，因为它取代了一个叉车工人去开叉车；它技术难度相对低，因为它只要知道从A走到B；它不上路，不用担心政府的法律法规，不需要考虑撞到人怎么办，是不是要停下。

　　Google Car能在高速公路上比99%以上的人都开的更好，但是它碰到一些极端的情况，比如大风大雨的漆黑天，它就没辙了，因为它不知道该怎么办，从来没看到过这种情况。这种情况下只有把车子停下来，但那一停会发生什么呢？当然就追尾了。

　　既然这种情况连Google也避免不了，为什么我们不先考虑做一些可控环境下的商业驾驶项目？这也是一个值得思考的问题，不是说Google的路线不对，而是说有两种路线可以走。

maozedong · 发表于 2017-6-2 18:40

谢谢楼主分享

		自动登录	找回密码
密码			立即注册

人工智能深度学习的挑战

马上注册，享用更多功能，让你轻松玩转本论坛。

相关帖子

浏览过的版块