无论你对大数据一无所知,还是想要拓展机器学习方面的知识;无论你只有三个小时,还是三分钟;无论你是想进一步了解这个技术还是那些高级应用,这个列表列举了YouTube上最棒的大数据视频。
1. 《Kenneth Cukier: Big Data is Better Data 大数据让我们做得更好》
毫无疑问,这个选自人气颇高的TED Talks的视频位列了我们的榜首。这个高水平演讲是在Dataconomy的诞生地—都柏林录制的,它分析了大数据的本质,并解释了为什么大数据更好。正如Cukier所说,“更多的数据给予了我们新的视角。它让我们能更好地进行观察,看见不一样的内容”。这个视频还介绍了一些大数据应用,比如癌细胞检测和预警,对于初学者来说容易理解又能激发兴趣。
2. 《The Future of Robotics and Artificial Intelligence 机器人学和人工智能的未来(吴恩达, 斯坦福大学, STAN 2011)》
吴恩达是一位机器学习专家,斯坦福大学的教授,同时也是Coursera的创始人。他介绍了自己在机器人学上的研究,涵盖了计算机视觉、强化学习等领域(包括一架自动驾驶的直升机),并提到了他的一个梦想——打造一个会打扫房间的机器人。
3. 《2012年谷歌 I/O开发者大会: SQL 和 NoSQL的后台之战》
这个视频中,谷歌职员Ken Ashcraft和Alfred Fuller就应用程序到底是用SQL还是NoSQL更好进行了激烈的辩论。辩论的主题包括查询、事务、可伸展性和管理模式。如果你并不确定你的应用程序更适合用关系型还是非关系型数据库模型,那么,我们推荐你看这个视频。
4. 《Introduction to NoSQL by Martin Fowler | Martin Fowler带你走近NoSQL》
如果你还是对NoSQL更有兴趣,那就让来自ThoughtWorks的Martin Fowler用50分钟带你快速全面地了解NoSQL。这个演讲向我们展示了NoSQL的起源,为什么你应该考虑使用它,以及为什么SQL和NoSQL之间并不是一场你死我活的斗争。
5. 《Big Data and Hadoop- Hadoop Tutorial for Beginners | 大数据和 Hadoop:初学者的Hadoop自学教程》
这个视频是一个自学教程的免费录制版,来自Edureka的付费交互课程。除了观看高水平演讲之外,如果你正想深入学习Hadoop的机制,那你适合从这个视频入手。在这里,你将会了解到Hadoop节点,如何读写分布式文件系统(HDFS),以及数据备份机制。如果你喜欢这个视频的内容,点击这里获取更多免费的Hadoop自学教程。
6. 《Explaining Big Data Lecture 1 | Machine Learning | 大数据解析第一课:机器学习》
这个视频是斯坦福大学一个非常流行的机器学习视频讲座课程的第一部分。吴恩达在Coursera上所开设的机器学习课程,就是以这些讲座的内容为基础,同时,这些讲座又简明扼要地描述了在为期十周的Coursera课程上不曾提到的其他内容。如果你想免费学习机器学习,那这个视频系列就是为你准备的。
7. 《Brains, Sex, and Machine Learning | 大脑,性,与机器学习》
Geoffrey Hinton是玻尔兹曼机、反向传播算法和对比散度算法的联合发明者之一,也是机器学习领域的全能大神,如果你想找人指导你学习神经网络,那他绝对是最佳人选之一。该演讲主要讲述了机器学习如何为生物学上那些令人费解的现象提供解释,其中就涉及了有性繁殖领域,也因此有了上面这个有趣的标题。
8. 《What is Hadoop? 什么是Hadoop?》
Intricity试图在三分钟内回答这个让数据科学领域的门外汉迷惑了多年的问题——Hadoop到底是什么?如果这个视频对你很有启发,不妨再看看他们的其他小视频,其中讲解了诸如“数据管制(data governance)”、“联机分析处理(OLAP)”和“元数据管理(Metadata Management)”等术语。
9. 《Big Ideas: How Big is Big Data? 大数据思维:要多大才算是大数据?》
这个列表上的大多数视频确实适合初学者,而这个来自EMC的视频更强调理解大数据的基础概念。如果你以为“大数据”就是根据规模定义的,请打开视频,准备好茅塞顿开吧。
10. 《Big Data Analytics: The Revolution Has Just Begun | 大数据分析学:革命刚刚开始》
SAS公司发布了Will Hakes博士(Link Analytics公司的联合创始人之一兼CEO)做的一个演讲,该演讲全面而深入地探讨了大数据分析学正在如何改变,并将持续改变商业智能的竞争生态。