《山巅周刊》定期分享科技、商业、医学及人文资讯,以及商业智慧和最佳实践,每周日发布。
相对人工智能虚拟机器人,更有前景的物理形态是将人工智能融入机器人,就是现在流行的术语——具身人工智能(Embodied AI,EAI),典型例子包括自动驾驶汽车和无人机,这些物理设备使用包括传感器、马达、机器学习和自然语言处理在内的一系列技术与周围环境进行交互并从中学习。与认知人工智能从人类和数据源对世界的描述中学习不同,具身人工智能能够从物理世界的经验中学习,直观表现是更灵活,更真实。
日本一直引领人形机器人领域,本田早在 1986 年就开始试验人形机器人。via HONDA'S ASIMO
具身人工智能的基本原理可以通过几个核心原则来解释:
- 与物理世界的互动;
- 感知与行动耦合;
- 通过经验学习;
- 情境理解;
- 多模态感官整合。
开发 EAI 系统的三个原则:
- EAI 系统不能依赖预定义的复杂逻辑来管理特定场景;
- EAI 系统必须包含进化学习机制,使其能够不断适应运行环境;
- 环境在塑造物理行为和认知结构方面起着关键作用。
物理机器人主要呈现机器外观和人类外观,人形机器人是仿照人类形态设计的通用双足机器人。虽然人形机器人在数量上远不如工业机器人,但人类喜欢把应用于沟通任务的物理机器人设计成人形,这样更实用,也更容易被人接受。人形机器人在公共兴趣和媒体曝光中也更受欢迎,Boston Dynamics Atlas、Unitree G1和Tesla Optimus等已经成为焦点,尽管创造的既有价值有限。
人形机器人旨在与人类一起工作以提高生产力,而这些机器人能够学习和执行人类早已习惯和理解的各种任务,例如抓取物体、移动货柜、装卸箱子等等。如果出现有三只手的机器人,人类会觉得诧异,也不会教它使用第三只手。
什么形态的智能人形机器人最受欢迎呢?我的评估是,人们不会太喜欢瓦力可爱又聪明,而是更喜欢RealDoll温柔又聪明。虽然当前的语音助手可以作为情感伴侣,但人类更喜欢有躯壳的灵魂。在孤立和宽容性趋低的人际关系潮流中,人们自然热衷可以进行个性化思维、情趣和行为塑造的朋友(突然想起2001年美国科幻片《人工智能》里的Gigolo Joe似乎可以成为Alpha版本)。参考:AI boosts adult toys’ user experience;State of the Sexbot Market。
目前,人工智能、人形机器人和玩偶娃娃还分属不同的世界,而且只限狭窄的应用场景,尽管人形机器人和玩偶娃娃都在积极引入人工智能,但它们三者的融合将带来人类新的福利和快乐,用户也会在拟真、情感和智能上不断索求。
当然,过于拟人化一定会带来威胁人类身份的不安,人类暂时还逃离不了既有的哲理、伦理和心理。
人物:宫崎骏
宫崎骏(Hayao Miyazaki)是日本漫画家,作为日本动画长片的大师级创作者获得了国际赞誉,被广泛认为是动画史上最有成就的电影制作人之一。
2009 年 7 月 27 日,日本动画电影《悬崖上的金鱼姬》导演宫崎骏在洛杉矶的一次电影特别放映会上摆姿势拍照。
宫崎骏的父亲宫崎飞机公司的负责人,该公司在二战期间专门制造战斗机的方向舵,这项工作使其家庭富裕。父亲喜欢购买画作给客人看,还是狂热的电影爱好者,这多少影响宫崎骏立志成为一名漫画家,一开始他不会画人物,几年都在画飞机、坦克和战舰。
宫崎骏电影中的几个角色都受到他母亲的启发。
动画制作技术的发展得益于19世纪电影摄影技术的发展,1928年上映的《汽船威利号》动画短片是首套有声动画,而1937年上映的《白雪公主》是首套动画长片。1958 年上映的日本第一部长篇彩色动画电影《熊猫与魔蛇》激发了宫崎骏对动画的兴趣,22岁刚从一所私立大学获得政治学和经济学学位,便作为动画师进入动画工作室。当然他的最初工作是补间,就是在专业画师创作的原画关键帧之间填补空白。
从补间画师到原画制作,进而担任首席动画师、概念艺术家、场景设计师和脚本创作者,宫崎骏辗转多个动画工作室,掌握了动画工业流程,也开始转向创作以女性主角为主的慢节奏作品。此间他为漫画杂志创作了连载漫画《风之谷》,故事背景是世界末日的地球,环境灾难威胁着人类。《风之谷》最后拍成了电影并大获成功,经常被视为宫崎骏的关键作品,巩固了他作为动画师的声誉。
《风之谷》大获成功推动宫崎骏创立吉卜力工作室
1985年,宫崎骏和动画长片导演高畑勋(Isao Takahata)以及漫画编辑铃木敏夫(Toshio Suzuki)等人创立了吉卜力工作室(Studio Ghibli),吉卜力的名字来源于阿拉伯语中的一种热风,象征着他们希望为动画界带来新风的愿景,许多工作室成员之前都曾在不同的工作室与宫崎骏合作过。
吉卜力以其高质量的动画作品和深刻的故事而闻名于世,在日本获得了评论界和商业上的成功。吉卜力工作室的代表作品包括《龙猫》(1988 年)单是商品利润就足以维持工作室多年的运营;《幽灵公主》(1997 年)一度成为日本票房最高的电影;《千与千寻》(2001 年)霸榜日本票房近 20 年,获得2003年第75届奥斯卡金像奖最佳动画片奖,经常被评为 21 世纪最伟大的电影之一;《苍鹭与少年》(2023年)获得2024年第 96 届奥斯卡金像奖最佳动画片奖。
宫崎骏和吉卜力工作室因 2001 年上映的《千与千寻》等电影而闻名。
宫崎骏的作品主角通常是坚强的女孩,反复出现诸如人类与自然的关系、艺术的重要性以及在暴力世界中维持和平主义的困难等主题,广泛关注环保、反战、女权、爱情和家庭,这些精美的画面、丰富的想象力和合乎逻辑的情节受到全球观众的喜爱。宫崎骏曾要求“手绘每一帧”,不得不接受引入电影图像后,也保持手工和电脑工作之间的正确比例。
宫崎骏经常被世界各地众多动画师、导演、作家和电子游戏设计师视为灵感来源,业界评论多将他与日本漫画家手冢治虫、美国动画师华特·迪士尼、日本电影制片人黑泽明相提并论。
创意软件开发者 Janu Lingeswaran 将他 3 岁大的布偶猫 Mali 转换为吉卜力风格
Sam Altman 将他在社交媒体平台 X 上的头像改为吉卜力风格。
The White House加入到表情包潮流中,一名被美国移民局特工逮捕的妇女正在哭泣
吉卜力风格的“分心男友”表情包
吉卜力成为一种文化符号。随着近年人工智能技术获得突破,观众可以将流行的网络表情包或个人照片转换成吉卜力创始人宫崎骏的独特风格。
以修改视频为例,“吉卜力化”只需要简单三步:
- 从视频中截取主角截图,使用 GPT-4o 模型中的 OpenAI 图像生成器将其修改为“吉卜力图片”;
- 使用Kapwing从视频中剪辑想要使用的音频部分。
- 使用Hedra,将“吉卜力图片”作为“图像框架”,将剪辑音频作为“音频脚本”。然后,输入提示词:“播客中的猫正在讲话”。
风格不受版权保护,这是一条普遍原则。日本吉卜力工作室拒绝发表评论,但宫崎骏过去一直对人工智能持批评态度——人工智能生成的动画是“对生命本身的侮辱”。
声音:没有智能手机的一年
以前我拿起智能手机时,很少是有意为之。更多的时候,我会陷入一个循环——打开一个应用程序,然后又打开另一个,然后又打开另一个,甚至忘记我最初想做什么。
在地铁车厢或者电影院等候区(虽然我仍旧不理解为什么那么多人要花时间等候看一场电影或者吃一顿火锅),人们机械而忙碌地划着手机,不约而同。
我每天都看到我的一个邻居带着他的狗出去散步。但他实际上并不是带着狗出去散步。他带着他的 iPhone 出去散步,狗也跟着一起出去散步。
放弃智能手机比戒掉毒瘾还要困难。
回顾我使用智能手机的高峰期(大约 2012 年至 2022 年),我注意到了一些惊人的事情。过去一年里,在没有智能手机的情况下,我创作的歌曲数量远远超过了我这十年的年度创作产量。
日常使用E Ink 屏幕的Light Phone手机和BOOX Tab C Ultra Prok 平板电脑,其他本身“内置生产力”的工具却会让工作效率更低。这个指南我们选择让生活更具目的性的工具,虽然我曾引入过 E Ink 显示器和手机,最终这些个人实践都失败了。
没有智能手机我怎么听音乐?用iPod Classic。数字时代和“智能”时代之间最大的中介点——无需登录、无需密码、没有“选择悖论”。
作者Tim Arnold是一名杰出的音乐家,事业之外倡导解决数字依赖。他是一名经过认证的苹果专家,早在 2010 年就为伦敦苹果公司工作,第一次拥有 iPhone 时,几乎没人拥有它。
《没有智能手机的一年》还提到社会心理学家Jonathan Haidt的《焦虑的一代》,这本书认为基于智能手机的生活改变或干扰了大量的发育过程,并已在《山巅周刊第205期》和《2024 年的全球书单》中特别推荐。
当我们的记忆全部存在于手机中时,我们会失去什么
纸质票证在作为付款凭证的短暂效用之后,仍可作为曾经生活过的证明。每张票证都可以与埋藏的记忆联系起来。
via 《商业周刊》:当我们的记忆全部存在于手机中时,我们会失去什么
谢益辉:再见
持续很难,比如一份长期工作,或者写博客。
谢益辉毕业于中国人民大学,获得爱荷华州立大学统计学博士学位,2006 年创办统计之都网站。他以软件工程师身份入职RStudio,是 R 编程语言 knitr、bookdown和 animation 等开源软件包的主要作者。2022年,RStudio更名为 Posit;2023年,谢益辉被解雇。在他的博客上,归档2024年的唯一文章是《再见,RStudio/Posit!》,也是最后一篇博客。
Simon Willison:结束我的周记
Simon Willison是Django Web 框架的共同创建者,从2002年开始大量写博客,然后形成比较固定的周记,并养成定期写作的习惯。但周记有一个缺点,由于可能有几项内容捆绑在一起,从而降低它们作为独立帖子的潜在影响力。
@kiwiinkyushu:决心很难
@kiwiinkyushu是一名生活在日本的新西兰人,从事数码摄影。他的摄影器材从Fujifilm X100F、Fujifilm X-T1换到GoPro;大约2016年移居到九州生活时开始写博客并决心继续写下去,到现在已经很少看到更新了,虽然他说自己有很多空闲时间。
工具:OCR
olmOCR是一款开源工具,旨在将 PDF 和其他文档以高吞吐量转换为纯文本。
Mistral OCR是世界上最好的文档理解 API,擅长理解复杂的文档元素,包括交错图像、数学表达式、表格和高级布局(如 LaTeX 格式)。
影像:网红桥
玻璃悬桥有利于游客观景,当然一些游客是为了体验“命悬一线”的刺激。这是广东省清远市黄腾峡生态旅游区的天门悬廊。
浙江省台州市神仙居景区如意桥,全长约100米,垂直高度约为140多米。
福建省福州市鼓楼区五四路的百福桥,是金鸡山至金牛山城市慢行步道的一部分。
👍