分析了TED上AI相关的550个视频,我得出了这些结论…

Posted by 活水智能 on July 23, 2024 · 1 min read

作者:GaryGeo

编译:活水智能

注明:全文略有删减

TED(Technology, Entertainment, Design)是全球领先的演讲平台,以其汇聚世界顶尖思想者、涵盖广泛领域的深刻演讲而著名,推动了全球范围内的知识共享和创新。

我经常在TED上观看人工智能(AI)有关的演讲,了解AI的能力、潜力和风险。截至目前,已有超过550个AI主题相关的TED视频,最早可追溯到2007年!

在学习TED上AI相关内容时,我意识到这些内容可以帮助我了解AI技术及其应用的演变。

为此,我开展了有史以来最大规模的数据分析,以梳理和追踪TED上AI主题的演化趋势。我使用YouTube上TED官方找好发布的视频作为数据来源,结合大模型和大Python代码,构建了一个知识图谱并开始分析。

本文重点在于分析过程,图谱构建过程将在其他文章分享。

Ray Kurzweil在2007年讲解AI的潜力

AI的演变趋势

我们先了解下视频发布的时间趋势。

按年份和主题统计的视频数量

早期阶段:先驱和开拓者(2007-2015)

在2007年左右,当AI对大众仍是一个小众话题时,TED已经邀请雷·库兹韦尔(Ray Kurzweil)等AI先驱进行演讲,他因研究“奇点”而闻名,还有知名数字助理公司的Palm Computing的杰夫·霍金斯。

IBM的“Jeopardy!”挑战者Watson于2011年推出,是当时最大的AI事件。

在这一时期,AI的讨论是零星的,偶尔出现,但不是每年都有。

值得注意的是,到2012年,TEDx活动已经举办了数千场,所以要么内容没有集中在AI上,要么这些视频没有发布在YouTube上(或者现在已经被归档)。

转折点(2016-2017)

2016至2017年间,AI在TED演讲中的关注度显著上升。

DeepMind的AlphaGo击败了围棋大师,它在2016年战胜世界围棋冠军李世石的。

与此同时,TEDx活动也在迅速扩展。到2017年,TEDx的演讲已超过10万场,AI主题吸引了许多新兴社区的演讲者。

深度学习的繁荣期(2017-2019)

2017至2019年间,AI相关的TED演讲数量大幅增加。

这是多个因素共同作用的结果。深度学习和神经网络研究在这一时期取得了重大进展,同时科技公司和风险投资加大了对AI初创企业的投资。

当时,数据科学成为热门职业,大数据也成为焦点话题。AI技术在Gartner新兴技术炒作周期中达到顶峰,反映了公众对AI的热情。

技术进步、资金增加、专业知识增长和公众兴趣高涨,这些因素促使更多AI相关讨论出现在TED演讲中。人们看到了AI对社会和产业的影响,TED成为探讨这一转变的重要平台。

口罩时期(2020-2021)

2020至2021年间,TED主频道的重点转向了医疗、远程工作和COVID-19疫情对社会的影响。

尽管AI不是主要话题,但在讨论应对疫情挑战的技术解决方案时,AI仍是一个重要的潜在主题。

ChatGPT时代(2022年底至今)

2022年底ChatGPT的发布重新点燃了人们对AI的兴趣,尤其是对大模型的关注。2023年和2024年,AI和大模型成为TED演讲的核心话题。

演讲者们讨论了这一技术的潜力、机遇,以及它对社会的影响和潜在风险。

时间线展示了TED演讲中反映的AI趋势和事件

从谷歌指数可以看出,ChatGPT发布后,大众对AI的兴趣急剧上升,现在才稳定在比ChatGPT出现前高出十倍的水平。

“人工智能”词条在谷歌的趋势图

除了视频数量和发布时间外,我们再看看还能从视频中发现什么。

🔼 点击上面关注我们 🔼

关键发现

接下来,我将深入挖掘这些视频的字幕和元数据。我的分析涉及提取关键概念(如主题、人物、机构等),并对视频进行分类,以构建知识图谱。

通过这些分析,我们可以了解主导TED AI视频的主题、人物和机构,并深入洞察AI时代精神。

最常见的50个词语

关键主题分布

AI类似电力或互联网,具备影响各行各业的潜力。这在视频数据集主题中得到了体现。

AI可能影响生活的方方面面,包括商业、社会、医疗、教育、工作、艺术和娱乐等。除了这些新兴应用,视频中还探讨了伦理、治理、安全等广泛问题。

从分布上看,大约55%的视频主要探讨AI的机遇,45%的视频关注AI的风险,相对平衡。

例如,有126个视频专门讨论AI与商业/工业。另一方面,113个视频关注AI对社会的影响、99个视频关注AI伦理与治理。

这种平衡在关注医疗(63个视频)和教育(55个视频)中也类似,同时也有关注未来工作(36个视频)。即使是较小的主题,这种平衡也依旧存在。

按主题划分的TED视频

上图从上到下分别是:商业/工业中的AI(126),社会中的AI(113),AI伦理和治理(99),医疗中的AI(63),教育中的AI(55),未来工作的AI(36),AI发展和安全(25),娱乐中的AI(24),AI与安全(8),其他(4)

提及最多的人物

比起抽象的趋势和概念,了解AI领域中的人物,有助于更深入地理解我们在视频中看到的内容。因为这些人物将是那段AI历史的重要组成部分。

视频中频繁提到的关键人物可以分为三类:

  1. 1. 技术思想领袖:在AI领域具备开创性贡献和思想领导力而。如艾伦·图灵、斯蒂芬·霍金、雷·库兹韦尔、马文·明斯基。

  2. 2. 商业领袖:在商业世界中因其对AI/技术的采用和应用有重大影响。如埃隆·马斯克、比尔·盖茨、马克·扎克伯格、史蒂夫·乔布斯)。

  3. 3. 受AI影响的其他领域专家:在其领域因AI进步而受到深远影响的专家。如棋界大师加里·卡斯帕罗夫、围棋冠军李世石、艺术家米开朗基罗。

按视频数量统计的18位最常被提及人物

上图从上到下依次是:埃隆·马斯克(45),艾伦·图灵(24),斯蒂芬·霍金(21),比尔·盖茨(15),克里斯·安德森(13),雷·库兹韦尔(13),加里·卡斯帕罗夫(13),李世石(9),马克·扎克伯格(9),马文·明斯基(9),史蒂夫·乔布斯(7),约翰·麦卡锡(6),尼克·博斯特罗姆(6),德米斯·哈萨比斯(5),亨利·福特(5),米开朗基罗(5),萨尔·汗(5),杨立昆(5)

尽管这些名字中的大多数都广为人知,但其中有几个我不得不进行研究,这份大名单几乎像是一场“AI名人知多少”的问答。

提及最多的机构

机构在AI的发展中同样扮演着重要角色。尽管最常被提及的机构名单可能不会让人惊讶,但它确实突出了过去17年TED视频的变化。

  • • Google被提及的次数几乎是第二名的两倍,即使将其收购的DeepMind视为单独实体。

  • • OpenAI尽管是新兴公司,但已经迅速获得了显著地位。

  • • MIT和斯坦福大学是AI研究和发展的领先学术机构。

  • • IBM、亚马逊和Meta在最新的大模型浪潮中被提及较少。提及他们的内容,超过80%的都在2022年前。

各机构多年累积视频数量

上图从上到下依次是:特斯拉(11),苹果(14),斯坦福大学(21),Facebook/Meta(24),IBM(26),DeepMind(29),亚马逊(30),MIT(34),微软(36),OpenAI(53),Google(94)

与个人相比机构的惯性更大。因此我们将在未来许多年内看到Google、微软、MIT、亚马逊、OpenAI等机构的身影。

但是并不意味着不会出现有影响力的新兴机构,但它们或被大公司收购(例如,Google收购DeepMind)。

对于这一趋势,17年的时间窗口可能还不够长。

结论

这些TED演讲提供了一个观察AI的视角,反映了AI从一个小众话题,逐渐转变为社会变革力量的过程。

随着AI的不断发展,TED将继续成为理解其潜力、挑战和围绕其发展的重要资源。单个演讲者和视频本身已经非常有影响力,但将它们汇总分析揭示的趋势增强了我们对AI的理解。

AI的故事仍处于早期,观察这些趋势如何演变,以及在这个动态领域中会出现哪些新话题非常有趣。

参考资料

## YouTube视频播放列表:https://www.youtube.com/playlist?list=PLJYAFlvvM68vuFBaGUGjxcexlACtGcsn0

视频数据集:https://gist.github.com/garygeo-19/1240a9e6b5aba36efcf13894f119f54e

搜索AI相关视频的应用:https://garygeo-19.github.io/AI-TED-Talks-KG/

作者创建的运用。顶部是搜索栏,下面是缩略图、关于浏览/点赞/评论/时长的统计信息,然后是包含可点击的实体和概念标签,如Elon Musk,AI在医疗中的应用等)

数据集说明

截至2024年5月的数据集由作者手动生成,可能存在错误或选择不一致,并且部分TED视频未在YouTube上发布,因此不完全覆盖所有内容。

分析涵盖了主TED频道、TEDx、TED-Ed以及已不活跃的TED Institute频道,提供了广泛的话题视角。数据提取和分类通过OpenAI的ChatGPT-4完成,可能也存在一些误差。YouTube数据显示,由于早期发布的视频有更多时间积累浏览量、点赞和评论,这些指标可能有所不同。

分析方法说明

以下是我进行此分析的方法。我计划在未来撰写一篇关于这一过程和技术的单独文章。

  1. 确定YouTube并建立了截至2024年6月1日的相关视频播放列表。

  2. 使用API和Python收集YouTube元数据和字幕。

  3. 在Python笔记本中处理数据,包括字幕摘要、概念提取和分类。这是通过OpenAI API(即LLM)完成的。

  4. 结果存储在包含3500多个节点和11000个关系的知识图谱中。

  5. 手动审查捕获的节点和关系以消除问题/错误,并合并相似概念(如Stanford和Stanford University等)。

  6. 创建有助于分析的数据集(例如,按年份/频道的视频计数,按人物的视频计数等),然后创建可视化图表。

  7. 将这些知识图谱数据加载到一个JSON文件中供Web应用使用。