**
热点回顾
**
OpenAI 发布 DALL・E 3,提供更精细的图像生成
微软发布 Copilot,统一 Windows 11、Microsoft 365 和 Edge 的 AI 功能
传谷歌开始小范围内测 Gemini,商业化日益临近
Google Bard 更新,连接 Google 生态
YouTube 推出一系列 AI 驱动的创意工具,从生成背景到启发创意
英特尔新一代 AI 芯片将于年底发布,笔记本可本地运行生成式AI
DemoGPT 与 LangChain 宣布合作,用自然语言就能自动生成应用程序
**
本周精选
**
消费者如何使用生成式 AI
科学家如何使用人工智能
人工智能能否重塑工作
生成式 AI 进入第二阶段:从技术热潮到真实价值的转变
Semantic Kernel:从商业思维到 AI 实施
OpenAI Cookbook 改版
斯坦福 CS224N 深度学习 NLP|2023 视频
Google AI 和 DeepMind 研究揭示 Transformer 的上下文学习机制
热点回顾
01
OpenAI 发布 DALL・E 3,提供更精细的图像生成
OpenAI 最近推出了新一代图像生成工具 DALL·E 3,目标是更准确、更细腻地将用户的想法转化为图像。OpenAI 采用了一种非常「AI」的方法,将DALL·E 3 与 ChatGPT 结合,利用 AI 来生成 Prompt,方便用户更轻松地获得理想的图片。基于 ChatGPT 构建,DALL·E 3 允许用户进行多轮对话,以便更精准地控制生成结果,并大大降低用户使用文生图的门槛。DALL·E 3 的实测效果令人惊艳,被认为有可能重塑「文生图」领域的格局。与前代相比,它在生成图像的准确性和细腻度上都有显著提升,甚至能够无需 prompt 就为图片配上合适的文字。为确保生成内容的安全性,OpenAI 采取了多项措施,限制生成不当内容,并对模型进行了多方面的安全性优化。
ref. https://openai.com/dall-e-3
https://mp.weixin.qq.com/s/Vy_Gz9iB-hUh6cRey5AL6A
02
微软发布 Copilot,统一 Windows 11、Microsoft 365 和 Edge 的 AI 功能
微软宣布将 Github、Microsoft 365、Bing、Edge、Windows 等产品的 AI 功能统一到 Copilot 中,作为人们日常的 AI 伴侣,为用户提供统一体验。Copilot 将在 Windows 11、Microsoft 365、Edge浏览器中提供 AI 服务,将于 9 月 26 日在 Windows 11 的免费更新时开始推出。Windows 11 将带来150多项新功能,包括 Copilot 带来的全新 AI 体验。Bing 将增加对 OpenAI 最新 DALL·E 3 模型的支持,并提供更加个性化的答案和全新的 AI 购物体验。Microsoft 365 Copilot 将于 11 月 1 日与 Microsoft 365 Chat 一起面向企业客户推出。此外,微软还推出了全新的 Surface 设备系列,展示了微软的最新 AI 体验。
ref. https://blogs.microsoft.com/zh/blog/2023/09/21/announcing-microsoft- copilot-your-everyday-ai-companion/
https://www.microsoft.com/en-us/microsoft-365/blog/2023/09/21/announcing- microsoft-365-copilot-general-availability-and-microsoft-365-chat/
03
传谷歌Gemini** 开始小范围内测,离商业化又近一步**
谷歌在今年的 I/O 大会上发布了最新大型 AI 模型 PaLM 2,并透露正在研发名为 Gemini 的多模态高效机器学习工具。为了加速 Gemini 的研发,谷歌在 4 月合并了 Google Brain 和 DeepMind 两大 AI 实验室。Gemini 模型的特点是拥有万亿参数,拥有前所未有的多模态能力,并计划提供不同版本以适应各种产品和应用。近期有消息称,谷歌已允许部分公司试用 Gemini 的早期版本,这预示着其即将商业化。据悉,Gemini 的算力在新的 TPUv5 Pod 上达到约 1e26 FLOPS,是 GPT-4 的五倍,并使用了 YouTube 上的大量视频字幕数据。Gemini 不仅支持文本生成和总结,还能帮助软件工程师编写代码和生成图片。谷歌希望 Gemini 能增强软件开发者的代码生成能力,以对抗微软的 GitHub Copilot。Gemini 还利用了谷歌从其消费产品中收集的大量数据,使其在理解用户查询意图上更为准确。谷歌计划通过 Google Cloud Vertex AI service 向企业提供 Gemini,并希望它能助力其云服务和其他产品。
ref. https://36kr.com/p/2432997666886022
04
Google Bard 更新,连接 Google 生态
近日,Google 发布了 Bard 的最新模型,可以与 Google 的应用和服务集成,为用户提供更有帮助的回应。Google 还推出了名为 “Bard Extensions” 的新功能,使 Bard 能够从用户日常使用的 Google 工具中找到并显示 Gmail、Docs、Drive、Google Maps、YouTube 以及 Google Flights 和酒店等相关信息。例如,用户可以要求 Bard 从 Gmail 中获取所有人的可用日期,查看实时的航班和酒店信息,查看前往机场的 Google Maps 路线,甚至在同一对话中观看 YouTube 上的相关视频。为了保护用户的隐私,Google 强调,如果用户选择使用 Workspace 扩展,他们的 Gmail、Docs 和 Drive 内容不会被人类审查员查看,也不会被用来向用户展示广告或训练 Bard 模型。Bard 还增强了 “Google it” 功能,使用户更容易核实其回答,并扩展了与 Bard 的对话功能。所有这些新功能都得益于 Google 对其 PaLM 2 模型的更新。Bard 现已支持包括中文在内的 40 多种语言。
ref. https://blog.google/products/bard/google-bard-new-features-update- sept-2023/
05
**从生成背景到启发创意, YouTube 推出一系列 AI 驱动的创意工具**
在 “Made On YouTube” 活动上,YouTube 发布了一系列 AI 产品和功能。今年晚些时候,YouTube 将测试 “Dream Screen”,这是一个新的实验性功能,允许用户仅通过输入提示即可为 Shorts 创建 AI 生成的视频或图像背景。为了简化视频制作过程,YouTube 推出了名为 “YouTube Create” 的新移动应用,该应用提供了视频编辑工具,包括精确编辑、自动字幕、配音功能以及访问滤镜、效果、过渡和免版税音乐的库。YouTube Studio 将利用生成 AI 来激发视频创意并帮助创作者构思。为了帮助创作者找到合适的音轨,YouTube 还将在 Creator Music 中引入辅助搜索功能。YouTube 还引入了名为 “Aloud” 的 AI 驱动的配音工具,帮助创作者将内容翻译成其他语言。
ref. https://blog.youtube/news-and-events/made-on-youtube-2023/
06
英特尔新一代 AI 芯片将于年底发布,可在笔记本本地运行生成式AI
英特尔即将推出其新命名方案下的首款 Core Ultra 芯片 —— Meteor Lake。这款芯片的特点是无需依赖云数据中心提供的算力,即可在笔记本电脑上运行生成式 AI 聊天机器人。这意味着,企业和消费者可以在不发送敏感数据到云端的情况下,测试类似 ChatGPT 这样的 AI 技术。英特尔 CEO 基辛格表示,这款芯片支持的 PC 可运行微软的 AI 助手 Copilot。Meteor Lake 芯片基于 Intel 4 的 7 纳米制程架构,是首款内置神经处理单元(NPU)的芯片,旨在提高 AI 性能。这款芯片还采用了英特尔的 FOVEROS 3D 封装技术,具有全新的性能核心和能效核心。在最近的 “创新 2023” 大会上,英特尔展示了一个笔记本电脑在无网络连接的情况下生成的歌曲,并以对话方式回答用户的问题。基辛格还透露,英特尔计划在接下来的两年内推出更多的 Core Ultra 系列芯片,并从明年开始生产采用 18A 制程的首批 Panther Lake 芯片。
ref. https://wallstreetcn.com/articles/3698223
07
DemoGPT 与 LangChain 宣布合作,用自然语言自动生成 APP
LangChain 与 DemoGPT 团队宣布合作,目标是简化生成式 AI 应用的创建。DemoGPT 是一个开源项目,致力于推动基于大型语言模型(LLM)应用开发的边界。它结合了多种基础模型的能力,只需提示语就能自动生成 LangChain x Streamlit 应用程序。DemoGPT 的核心架构包括规划、任务创建、代码片段生成、代码片段组合和数据库保存等阶段。DemoGPT 提供了一个简单的安装和使用过程,支持命令行界面和 Python 库两种方式。LangChain 和 DemoGPT 的合作还带来了 DemoGPT Marketplace,该社区允许开发者和 AI 爱好者创建、展示、交换甚至变现他们自动生成的应用,社区用户可合作、迭代和完善这些应用。DemoGPT Marketplace 旨在建立一个协同的生态系统,弥合创作者和消费者之间的鸿沟。
ref. https://blog.langchain.dev/langchain-demogpt-new-era-for-gen-ai- applications/
本周精选
01
消费者如何使用生成式 AI
自从 ChatGPT 发布以来已经过去 9 个月,它在 7 个月内成为了月活跃用户达到 1 亿的最快消费应用,开启了生成式 AI 的新时代。除了 ChatGPT,消费者如何与生成式 AI 产品互动呢?为了回答这些问题,a16z 使用 SimilarWeb 的流量数据对月访问量最高的 50 个生成式 AI 网产品进行排名,并分析了这些产品的增长趋势。以下是他们的 6 个发现:
大多数领先的产品都是围绕生成式 AI 从零开始构建的。80% 的网站是新出现的,只有 5 个是大型科技公司的产品或被收购。
目前领先的是 ChatGPT,占据整个前 50 名列表的 60% 月度流量,估计每月有 16 亿次访问和 2 亿月活跃用户。
LLM 助手(如 ChatGPT)占主导地位,但 AI 伴侣和创意工具正在崭露头角。LLM 聊天机器人占据了前 50 名列表中 68% 的流量。
已经出现了早期的 “赢家”,但大多数产品类别仍有待开发。
头部产品的收入是完全自然的(没有付费营销),消费者愿意支付。90% 的公司已经开始盈利,他们几乎全部采用订阅模式。
移动应用仍然是一个正在崭露头角的生成式 AI 平台。尽管现在消费者在移动设备上的平均使用时间比桌面多 36 分钟,但我们预计随着技术的成熟,将会出现更多的移动优先的生成式 AI 产品。
原文链接:https://a16z.com/how-are-consumers-using-generative-ai/
https://mp.weixin.qq.com/s/_621nbcm_DCvUkSUbWh53g
02
科学家如何使用人工智能
在 2019 年,麻省理工学院的科学家们利用 AI 技术在现代医学中发现了一种新的抗生素 halicin。此后,另一支团队在 2023 年 5 月发现了第二种抗生素 abaucin。这两种化合物的特点在于它们对抗抗生素耐药细菌的潜在用途,以及它们是如何被识别的。还有研究者们使用 AI 模型在数百万的候选化合物中筛选出最适合对抗 “超级细菌” 的化合物。除了加速药物的发现过程,AI 技术在其他领域也显示出巨大的潜力,如加速预测天气的计算模拟、模拟经济学实验、控制复杂的核聚变实验设备、增强低分辨率图像、预测蛋白质结构等。Google DeepMind 的联合创始人 Demis Hassabis 认为,AI 技术可能带来新的 “发现复兴”,并作为人类创造力的放大器。AI 不仅可以加速科学研究和发现的进程,还可以帮助科学家更好地模拟和理解复杂系统。
文章链接:https://www.economist.com/science-and-technology/2023/09/13/how- scientists-are-using-artificial-intelligence
03
人工智能能否重塑工作
近期,一项由社会科学家与波士顿咨询集团(Boston Consulting Group)合作的研究揭示了 AI 对未来工作的重要影响。在这项规模前所未有的实验中,研究人员发现使用 ChatGPT-4 顾问的人在 18 种不同任务上的表现均超过了未使用 AI 顾问的人。具体来说,使用 AI 顾问完成的任务平均增加了12.2%,任务完成速度提高了 25.1%,质量比未使用 AI 顾问提高 40% 。然而,AI 并不是无所不能的。在某些任务上,过度依赖 AI 可能会导致错误的结果。研究者提出了 Centaurs(半人马)和 Cyborgs(赛博格)两种方法,Centaurs 方法明确区分人和机器的工作,而 Cyborgs 方法则深度整合两者,使其互补。总体而言,AI 已经成为当前工作的强大相关因素,我们需要做出选择,决定如何利用 AI 使工作更有生产力、趣味性和意义。
文章链接:https://www.oneusefulthing.org/p/centaurs-and-cyborgs-on-the-jagged
04
生成式 AI 进入第二阶段:从技术热潮到真实价值的转变
Sequoia Capital 在一年前提出了一个假设,即生成式 AI 将成为技术领域的一个深远的平台转变,随后引发广泛关注。经过数十年的技术进步,生成式 AI 已经准备好起飞。ChatGPT 的崛起引发了前所未有的创新热潮,但随着时间的推移,人们对 AI 的兴趣从极度兴奋转变为近乎狂热。尽管出现了许多问题和挑战,但生成式 AI 已经比 SaaS 有了更成功的开端,一些应用如 ChatGPT、Midjourney 和 Character 已经成为家喻户晓的名字。但与此同时,许多 AI 公司仍然没有找到产品与市场的匹配或可持续的竞争优势。如今,市场正从 “Act 1” 转向 “Act 2”,后者将从客户的角度出发,端到端解决人类问题,不仅仅展示技术,更使用基础模型作为更完整解决方案的一部分,并引入新的编辑界面。文章预测了一些市场趋势,包括生成式界面的出现、新型编辑体验、 Agent 系统的发展、系统级的优化等。总的来说,生成式 AI 仍处于其 “尴尬的青春期”,但作者坚信生成式 AI 的潜力,并对其未来充满期待。
原文链接:https://www.sequoiacap.com/article/generative-ai-act-two/
05
Semantic Kernel:从商业思维到 AI 实施
Semantic Kernel 是微软推出的轻量级开源 SDK,可将像 OpenAI、Azure OpenAI 和 Hugging Face 这样的大型语言模型 (LLMs) 与传统的编程语言如 C#、Python 和 Java 集成在一起。它作为 App 和 OpenAI 之间的中间件,简化了与大模型 AI 的交互,提供了规划、资源、步骤和管道等概念来组织和执行用户请求。Semantic Kernel 还提供了嵌入式内存,突破了令牌限制,优化了调用次数和结果质量。Semantic Kernel 提供了一个桥梁,使开发者通过 “Semantic Kernel” SDK 快速地在开发的应用程序中使用 LLMs。
项目链接:https://github.com/microsoft/semantic-kernel
课程链接:https://www.deeplearning.ai/short-courses/microsoft-semantic-kernel/
中文字幕:https://space.bilibili.com/589397373/channel/collectiondetail?sid=1702784
科普介绍:https://foresightnews.pro/article/detail/43453
06
OpenAI Cookbook 改版
“OpenAI 实践手册”网页大改版。这是一个汇聚了「使用 OpenAI API 进行各种技术应用的文章」的宝库,涉及使用不同数据存储和检索技术与 OpenAI API 结合以实现问答、语义搜索、文本生成等任务。
原文链接:https://cookbook.openai.com/
中文翻译(旧版):https://github.com/bytechina/openai-cookbook-zh
07
斯坦福 CS224N 深度学习 NLP|2023 视频
自然语言处理(NLP)是人工智能(AI)的重要组成部分。近年来,深度学习方法在许多 NLP 任务上获得了非常高的性能。在本课程中,学生将全面了解用于 NLP 的尖端神经网络。
https://www.youtube.com/playlist?list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
08
Google AI 和 DeepMind 研究揭示 Transformer 的上下文学习机制
Google AI、苏黎世联邦理工学院和 Google DeepMind 通过逆向工程的方式,对 Transformer 进行了深入分析。研究发现,Transformer 在前向传递中实现了所谓的「mesa 优化」,这种优化算法能够展现出上下文中的小样本学习能力。研究还揭示了 Transformer 在自回归序列任务上的训练过程中,其实现了适当的 mesa 优化,从而能够进行少样本上下文学习,而无需任何微调。这为理解大型语言模型如何进行上下文学习提供了新的视角。
论文地址:https://arxiv.org/abs/2309.05858
欢迎加入阳志平老师创办的「玩转GPT」知识星球,了解更多前沿论文、使用技巧、原创产品,与 2100+ 成员一起碰撞无限创意!
**👇 **加入知识星球,一起玩转GPT!
👇 点击关注「活水智能」