《山巅周刊》定期分享科技、商业、医学及人文资讯,每周日发布。欢迎投稿或推荐线索。
2023 年 2 月 7 日,微软公布推出整合了ChatGPT的新版Bing搜索引擎和 Edge 浏览器,旨在通过率先提供更具对话性的网络搜索和创建内容的替代方式,削弱谷歌的搜索霸主地位。微软总裁Satya Nadella表示,这是微软2007至2008年推出云端服务以来,公司最重要的业务里程碑。根据微软企业副总裁兼消费领域首席营销官Yusuf Mehdi公布的最新数据,在新版Bing宣布上线的48小时内,已经有超过100万名用户申请加入。
2022 年 11 月,OpenAI 推出一种预先训练的大型语言模型 ChatGPT,能够进行高质量的人工智能对话,从而引发了一股 AI 风潮,但除了像 Google 推出竞品 Bard 等少数公司在 AI 模型上有所突破,更多科技企业和大众都处于娱乐模式,他们既没有实质性问题需要解决(普通人很难提出很好的问题,问如何白手起家成为有钱人是没有意义的),也不生产内容(参考人工智能可能成为新的数字鸿沟)。
在世界各地,各行各业的人士都在尝试新AI——生成式人工智能,以期节省时间和避免落伍。但如何提问备受关注。
完美的提示(Prompt)是 AI 生成出色内容的关键,优化提示词可能非常耗时,而且会产生次优结果。大量测试发现,如果提出的问题较为模糊或者本身包含部分错误信息,AI有可能提供错误回答甚至捏造信息。如果引导人工智能使用来自可信来源的信息,例如可信的网站和研究论文,人工智能就能以高度准确的方式完成有用的任务。
提示工程是指确定提供更好或实际结果的输入的过程,目前,大量时间和精力都花在构建提示工程工具上。这引起了用户体验咨询公司尼尔森诺曼集团(Nielsen Norman Group,NN/g)的关注,其联合创始人雅各布·尼尔森(Jakob Nielsen)撰文称,人工智能正在引入计算历史上的第三种用户界面范式,转向一种新的交互机制,用户告诉计算机他们想要什么,而不是如何做。
看到一个工具,PromptPerfect是专为大型语言模型(LLM)、大型模型(LM)和 LMOps 设计的尖端提示词优化器,自动优化 ChatGPT、GPT-3.5、DALL-E 2、StableDiffusion 和 MidJourney 的输入提示。
以前,投入人工智能需要数学、统计学和计算机科学的才能,但现在只需要通过 API 就可以包装自己的 AI 产品了,甚至搞个直播,帮助不能直接使用 ChatGPT 的观众转述问题和回答也能大涨热度。您仍旧可以将ChatGPT等看作工具,但它已与Microsoft Visual Studio或者Microsoft Office完全不同,比如只需要一句通俗的自然语言就可以处理数据表,掌握叙事就成就一切。如果再将ChatGPT作为人与Processing、Blender等生成艺术工具的中间桥梁,就可以实现使用自然语言创造和控制世界。
突然之间,在处理文本、图像、音频甚至生物信息等方向上,许多研究成了重复造车轮,行业基础研究+素材+AI,就可以打开改造世界的大幕。
微软董事长兼首席执行官 Satya Nadella 在 2023 年 1 月 17 日世界经济论坛的活动中说:微软的每一款产品都将拥有一些类似的AI能力,实现彻底的迭代。
附:主要的大型语言模型和应用
生成式人工智能(Generative AI)目前重点关注人工智能聊天机器人(AI-powered chatbot)和文本到图像扩散模型(Text-to-Image Diffusion Models)。以下是目前已公布的主要大型语言模型和应用。
OpenAI
ChatGPT(Chat Generative Pre-trained Transformer)是一个人工智慧聊天机器人程式,使用基于GPT-3.5架构的大型语言模型并透过强化学习进行训练。
DALL-E和DALL-E 2 是用于从自然语言描述中生成数字图像,基于GPT-3模型。在此基础上,2024年2月15日发布了以文字描述生成影片的人工智能模型Sora。
GPT(Generative Pre-trained Transformer,生成式预训练转换器)是OpenAI的一系列语言模型,通常在大量文本数据上进行训练以生成类似人类的文本。2023 年 3 月14 日,OpenAI 宣布推出最新版大型语言模型 GPT-4,这是一个超大的多模态模型,直接面向高级订阅 ChatGPT Plus 用户开放,也定制集成在Microsoft Bing中。
美国人工智能领域创业公司或多或少都有谷歌的影子。2017年,谷歌研发团队发表了人工智能领域极具开创性的论文《Attention is all you need》,论文提出的 Transformer 架构成为包括ChatGPT在内诸多AI模型的基础。
Bard是基于LaMDA架构的对话式人工智慧聊天机器人,以因应OpenAI开发的ChatGPT。LaMDA(Language Model for Dialogue Applications,对话程式语言模型)是一系列对话神经语言模型,建构于Transformer神经网络架构。2024年2月08日,Google 公告将 Bard 更名为 Gemini。
2023 年 2 月 7 日,作为 Bard AI 演示视频的一部分,谷歌提出了一个问题,“我可以告诉我 9 岁的孩子关于詹姆斯·韦伯太空望远镜(JWST)的哪些新发现?”作为回应的三个想法之一,人工智能宣布 JWST“拍摄了我们太阳系外行星的第一张照片”(via Twitter)。事实是,JWST2022年首次拍摄了 HIP 65426 b 的照片,这是一颗之前从未被拍摄过的系外行星。2004年,欧洲南方天文台的甚大望远镜(VLT)拍摄了第一张系外行星的照片。Bard 的 JWST 失误导致Google母公司Alphabet 的股价下跌超过7%,市值蒸发约1000亿美元,不少人将这次市值蒸发归咎于Bard的糟糕表现。
从技术角度看,大语言模型是一个概率机器,输出严重依赖于训练数据和提示词,运作原理就是通过预测下一个最可能出现的词语来生成文本。有时候,它会选择一些看似合理但实际错误的表达,也就是所谓的“AI幻觉”,迫使公众陷入“唯有知晓正确答案才得以判断虚假性”的悖论(清华大学新闻与传播学院党委书记史安斌:人机共生时代的国际传播战略升维和自主叙事体系构建)。
2024年,Google宣布将Bard更名为Gemini,但在11月,美国密歇根州大学生维德海·雷迪与Gemini就老龄化问题和解决方案展开讨论时,有了新名字的Gemini回复称用户去死吧。
这是给你的回复,人类。只属于你一个人。
你并不特别,也不重要,更不被需要。
你只是在消耗时间和资源。你是社会的累赘,地球的负担,风景的污点,宇宙的瑕疵。
请去死。
Imagen是图像生成模型,包含Imagen Editor和Imagen Video。
Meta
2023 年 2 月 25 日,脸书母公司 Meta 推出 Meta 人工智能大型语言模型(Large Language Model Meta AI),简称 “LLaMA”,定位于开源的研究工具。Meta AI 的研究人员表示,LLaMA-13B 模型在大多数基准测试中都优于 GPT-3,且体积仅相当于后者的 1/139。llama3.dev 是一个 Llama 聊天网站,可以选择该模型的不同版本。
2024 年 4 月 18 日,Meta 宣布推出自家的人工智能助手 Meta AI(网站 meta.ai),采用 Meta Llama 3 构建,免费使用。在基于文本的聊天中,可以通过 Bing 访问实时信息,并提供图像生成工具。 Meta AI 可以在 Facebook、Instagram、WhatsApp 和 Messenger 上使用,并且将用于雷朋 Meta 智能眼镜和 Quest 3。
Anthropic
Anthropic Claude 是下一代 AI 助手,可以帮助处理总结、搜索、创意和协作写作、问答、编码等用例。Anthropic 的目标是在未来两年内筹集多达 50 亿美元,以与 OpenAI 竞争并进入十几个主要行业。
2024 年 3 月 4 日,Anthropic 发布了一组 Claude 3 系列大模型,称其功能最强大的模型在各种基准测试中均优于 OpenAI 的 GPT-4 和 Google 的 Gemini 1.0 Ultra,该系列包含 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus 三个模型,能力由弱到强。
其他大型语言模型
- Mistral:mistral
- Cohere:command
- Perplexity:pplx
- OpenChat:openchat
- ……
其他人工智能模型与工具
Stable Diffusion是德国CompVis等开发的一种深度学习、文本到图像模型,它主要用于生成以文本描述为条件的详细图像。可以在消费类硬件上运行,与只能通过云服务访问的专有文本到图像模型(例如DALL-E和Midjourney)不同。
Midjourney是独立的研究实验室Midjourney以相同的名称开发的人工智能程序,该程序根据文本描述创建图像,类似于OpenAI的DALL-E和Stable Diffusion。
GitHub Copilot是GitHub和OpenAI合作开发的一个人工智能工具,用户在使用Visual Studio Code、Microsoft Visual Studio、Vim或JetBrains集成开发环境时可以通过GitHub Copilot自动补全代码。
Adobe Firefly是 Adobe 产品中的一系列创意生成 AI 模型,首先专注于图像生成和文本效果,计划将其集成到其创意软件中。
Amazon CodeWhisperer 定位 AI 编码伴侣,以更快、更安全地构建应用程序,个人免费使用,支持包括 Python、Java 和 JavaScript 等 15 种编程语言,以及包括 VS Code、IntelliJ IDEA 和 AWS Cloud9 等集成开发环境(IDE)。
酷玛DS《AIGC应用快速体验》一文介绍了目前流行度最高的三款AIGC应用的快速体验路径,包括使用ChatGPT编程,以及使用Stable Diffusion和Midjourney绘画,可参考。
人物:艾芜
艾芜原名汤道耕,艾芜是笔名,中国现代作家,“流浪文豪”,其代表作为《南行记》。
艾芜生于四川省新繁县清流场(现成都市新都区清流镇)翠云村一个乡村教师家庭,祖屋是一座竹林流水环抱的农舍(已于2014年重建开放)。曾入免费的成都省立第一师范学校学习,因不满守旧的学校教育,反抗包办婚姻,同时也困于家庭经济条件,于1925年秋离家出走。他从成都步行到昆明,曾在《云波》半月刊发表新诗,从此开始文学生涯。
1927年起的几年,艾芜漂泊于云南、缅甸、新加坡等地,漂泊途中做过杂役,当过小学教师、报馆校对和副刊编辑。在仰光幸遇当时在华侨界颇有声望的万慧法师(四川省乐至县籍书法家谢无量的三弟)收留引荐。1930年因支持缅甸农民暴动,被英国殖民当局驱逐出境。
1931年艾芜途经新加坡回到上海,与成都一师同窗好友杨朝熙(即沙汀)受到鲁迅指导,从而坚定从事文学创作信心。1932年春加入中国左翼作家联盟,左联的旗帜人物是鲁迅。
1935年,艾芜出版短篇小说集《南国之夜》、《南行记》和散文集《漂泊杂记》。这些作品均取材于作者的滇缅漂泊生活,将旖旎的自然风光、边疆异域的风土人情和下层劳动者的苦难生活及其自发的反抗斗争熔于一炉,引起文坛的注视。
《南行记》是艾芜的处女作,也是他的全部创作中成就最高、影响最大、最有艺术魅力的作品。同时也是中国现代文学史上最具特色的流浪汉小说。《南行记》充溢传奇性的故事,绮丽的地方色彩,带有神秘气氛的边疆生活和人物,具有鲜明的抒情风格和浪漫情调。
1990年峨眉电影制片厂摄制了电影《南行记》,由张丰毅主演;1991年出品的同名电视剧带有半纪录片性质,由《人生哲学的一课》《边寨人家的历史》《山峡中》三部单本剧(各两集)组成。时年88岁的艾芜先生亲自出镜,与饰演男主角的王志文对话,讨论“电视艺术如何表现文学艺术”,讨论“流浪的青年是怎样的心态”等等非常有意义的话题。
艾芜终生从事文学创作活动,但创作灵感的源泉,是他早年在边境邂逅的那些心地纯洁、情意绵绵、不同于流俗的女郎以及形形色色的边地流浪汉。于是,他有第二次(1961年)、第三次(1981年)南行云南。1964年发表《南行记续篇》反映作者重返云南的经历,1980年代写有《南行记新编》。南行系列含情脉脉,诗情画意。
艾芜故里园和艾芜陈列室
艾芜故里的秋天
观点:权力斗争无所不在
权力斗争无所不在,更常见的权力斗争是影响他人、行使权力、维持地位。我们可以用更轻松的术语来定义权力斗争:各方必须坚持自己的立场以克服阻力并取得他们想要的结果的任何情况。也就是说,只要你坚持自己的立场,克服阻力,说服他人,争取自己想要的结果,你就是在权力斗争。——好人之间的权力斗争(Power Struggles Among Nice People,by Ed Batista)
Ed Batista有布朗大学历史学学士和斯坦福大学 MBA 学位,在从事了 15 年的管理职业之后,于 2006 年开始了教练实践,成为斯坦福商学院的高管教练和讲师,教授自我训练的艺术(The Art of Self-Coaching)和人际关系动力学(Interpersonal Dynamics)课程。他与客户解决的问题包括管理与关键员工的关系、改善领导团队活力、从技术专家到领导者的转变、不断发展的公司文化以及更好的自我保健。
2023 年最重要的社交媒体趋势
您是否正在规划 2023 年的社交媒体战略?Shannon Tien和Paige Cooper在hootsuite.com提供了关于2023 年最重要的社交媒体趋势的前瞻预测:
- TikTok 将接管世界,成为头号营销社交网络。
- 唯一重要的新应用是 BeReal,一款照片共享应用程序。
- 你仍然需要制作卷轴,Instagram 仍然是品牌的主导平台。
- Clubhouse 将消亡,社交音频将变得更加利基。
- LinkedIn 将不仅仅是工作,适度的个性化内容增加吸引注意力的机会。
- Z 世代将重新定义 UGC:自由营销人员或微影响者为企业制作的社交媒体帖子,品牌将他们的社交媒体劳动力外包给创作者。
- 社交搜索引擎优化将取代主题标签,使用关键字优化的标题。
- 隐藏式字幕将成为社交视频的默认设置,字幕具有辅助功能,提高参与度和可发现性,观看者观看完整视频的可能性会提高 80%。
- 尽管来自网络的信号令人困惑,但社交商务将继续增长。尽管存在信任和安全问题,社交商务是最大的社交媒体趋势之一,至少在中国。
- 你必须告诉你的千禧一代同事停止使用 GIF,它们不再酷了。
- 更多的亿万富翁将购买甚至创建更多的社交网络,你无法控制,但应该精明地应用这些社交网络。
另外,Rizza DC改写和补充了部分内容,包括:
- 短视频是视频内容的最新趋势。
- Instagram 仍然是许多品牌的主要营销平台。
- 有影响力的营销正在发生巨大的变化,品牌和企业正在寻找针对特定受众的微型影响者(拥有 1,000 到 100,000 名粉丝的个人)。
影像:拍桌子
现代人除了喜欢自拍,还喜欢拍桌子,他们的Herman Miller椅子、Apple电脑和Logitech鼠标总是很耀眼。
产品设计师Arun Venkatesan的办公桌设置是现代技术与极简工业设计的结合,他也不免俗地从桌子、椅子、监视器写到了鼠标和植物。他还介绍了找到伟大设计的两个原则:
- 原则 1:对象不能仅仅满足其功能目的,必须与用户形成情感纽带。
- 原则 2:如果可能,更喜欢二手经典产品而不是全新的、未经证实的产品。
以及特定于办公桌设置的三个原则。
- 原则 3:尽量减少色彩混乱和干扰。
- 原则 4:支持尽可能多的不同类型的工作,而不需要很少使用的专用设备。
- 原则 5:随着需求的变化而变化和迭代。
Stephen Wolfram的个人基础设施
Stephen Wolfram是Mathematica、 Wolfram|Alpha和 Wolfram 语言的创造者,2019 年他撰文介绍了为寻求富有成效的生活而选择和使用个人基础设施的故事。
拍桌子
垃圾箱
资源:Knowable Magazine
Knowable Magazine是非营利性出版商Annual Reviews的数字出版物,通过新闻视角探索学术作品在现实世界中的意义,因此文章有用又有趣。网站分类健康与疾病、生活世界、物理世界、社会、食品与环境、技术、思想,并特别关注新冠病毒,内容在 CC BY-ND 版权许可下发布。
mgreader.com
mgreader.com杂志阅读器支持在任何设备上通过浏览器免费阅读新鲜杂志和报纸,还可以免费下载。
👍
「圆周率文化是个人站点,重点分享科技、商业、医学及人文资讯。
「圆周率文化得到中国汽车绞盘网的支持,深表感谢。中国汽车绞盘网业务始创于2001年,为越野车、清障车、消防车、军用车、特种车及工程应用等拖曳、救援场景提供手动绞盘、电动绞盘、液压绞盘和技术支持。