《山巅周刊》定期分享科技、商业、医学及人文资讯,以及商业智慧和最佳实践,每周日发布。
科幻电影《瞬息全宇宙》(Everything Everywhere All at Once,2022)在2022年至2023年影奖季斩获了奥斯卡最佳女主角奖等多项大奖(但推荐评分较低),其导演Evan Halleck更是一名视觉特效艺术家,在电影制作过程中使用了Runway公司的全球首款AI生成视频软件RunwayML。
Runway是由Cristóbal Valenzuela(CEO)、Anastailities Germanidis(CTO)和Alejandro Matamala Ortiz(CDO)于2018年创立的一家全栈应用人工智能研究公司,为内容创建训练和构建生成人工智能模型。Runway已发布数十个创作产品,包含音频、图片、视频、3D和生成五个大类,涵盖了几乎所有的音视频内容生成和处理工具。
Valenzuela在智利圣地亚哥阿道夫·伊巴涅斯大学学习经济学、电影和设计,他的大多数同学都从事金融工作,但他进入了智利最大的电影制作公司。移居美国后,Valenzuela在纽约大学学习交互电子媒体,并遇到了他的创业伙伴。
Runway是福布斯公布的2023年度AI 50榜单最值得关注的上榜公司之一,曾与德国慕尼黑大学合作构建了第一个版本的 Stable Diffusion,这是一种根据文本提示生成图像的人工智能技术。除了在电影《瞬息全宇宙》、《黑寡妇》和CBS 综艺节目斯蒂芬·科尔伯特深夜秀中制作特效,Runway的客户包括传媒集团 CBS、MBC,广告公司 Assembly、VaynerMedia,设计公司 Pentagram 等。
2023年3月,Runway发布第二代人工智能模型Gen-2,这是第一个商业可用的文本到视频模型,它的上一代Gen-1只支持从现有视频中生成新视频。Gen-2代表了人工智能辅助视频生成的重大飞跃,为用户提供了无需参考图像或源视频从头开始创建视频的能力。从大型制作公司到独立视频创作者,除了制作令人印象深刻的视觉效果,Gen-2更有利于降低费用和缩短制作时间,可以改变电影的未来。
今年春天的金沙国际电影节期间,在接受Collider的Steve Weintraub采访时,漫威主打电影的导演Joe Russo预测,两年内,人工智能将能够创作一部成熟的电影。
2023年11月28日,仅成立六个月的Pika Labs正式向大众发布了第一个产品Pika 1.0,能够生成和编辑3D动画、动漫、卡通和电影,成为Runway Gen-2最强竞品。
以下图片取自官方放出的效果视频,群众反映效果炸裂。
elon musk in a space suit,3d animation by @pika_labs
对比同一prompt在Stability AI 推出的新一代图像合成模型 Stable Diffusion XL Turbo(SDXL Turbo)的生图效果,好在后者基本“实时”的速度,而且开源。
换装 by @pika_labs
外界使用竞品一词可能源于Pika 1.0有惊艳的效果和易用性,但这款人工智能视频工具并不是为专业人士量身定制的,而是更多日常消费者。考虑到Adobe、Runway 和Stability AI等已经取得了显着的领先优势,早期的 Pika 只专注于制作动画,对于2023年4月才创立的4人团队,这个定位也很中肯。
创始人Demi Guo和联合创始人兼CTO Chenlin Meng,都是斯坦福大学AI Lab前博士生。Pika CEO Demi Guo(左)从小喜欢诗歌和创意写作,联合创始人兼首席技术官Chenlin Meng(右)希望成为一名动画师。在2022年参加Runway的首届AI电影节,发现Runway和Adobe Photoshop的工具并不好用,自己的作品也并未获奖。“视频是娱乐的核心,但迄今为止制作高质量视频的过程仍然很复杂且需要大量资源”,Pika说。Lightspeed(也是 Stability AI 的投资者)认为,“专业品质的视频创作也将通过生成人工智能而变得民主化”。
生成式人工智能于 2022 年取得突破,是自十多年前移动和云兴起以来最令人兴奋的技术。技术一直支撑着创新爆发,就像2009 年至 2013 年诞生了数十家由移动和云技术驱动的变革型初创公司一样,这一次,生成式人工智能将充当催化剂。
2023 年 10 月 16 日,IDC 发布预测报告,预计生成式 AI 投资将从2023年的 160 亿美元增至 2027 年的 1430 亿美元。
白热化竞争中产品的定位愈显重要。在专业视频领域,Adobe Primere和 DaVinci Resolve是精细化的保证,也有更新 AI 插件加持;在轻量化视频应用上,高度嵌入TikTok工作流体系的Capcut也已成为标杆。不论是Runway还是Pika Labs,创意天马行空,变化瞬息全宇宙(电影的两种中文名)。
人物:Paul Lutus
Paul Lutus早在 1976 年就退出了 NASA 的激烈竞争,以每月 40 美元的顾问收入住在俄勒冈州的一个荒野山顶上。然后他购买了Apple II,在一间十二英尺乘十六英尺的单间小屋中编写了Apple Writer。在计算机行业,Lutus被称为俄勒冈隐士,《数字游民(Digital Nomad)》曾提到他。
Apple Writer 是有史以来最畅销的文字处理程序之一,1979 年正式发布,五年间为Lutus赚了六百万美元,仅 1983 年就赚了300 万美元。他用一些软件专利费购买了一套漂亮的房子和穆尼 201 飞机,方便飞往加利福尼亚州的苹果总部,或者只是沿着俄勒冈州海岸缓慢飞行,观看鲸鱼。关注软件开发人员的播客CoRecursive称Paul Lutus可能是最早的远程开发人员。
1975年出生的Lutus拥有广泛的科学技术背景,但出身贫穷,没有大学学历(实际上是七年级的辍学者)。在成为一名NASA工程师前,他曾是旧金山的街头电工。Haight-Ashbury 是 20 世纪 60 年代鲜花盛开的地方,露宿街头被认为是一个浪漫的想法。
Lutus加入NASA的承包商,最初的任务是设计可调光荧光灯,然后使用计算尺和可编程计算器设计其他航天器组件、太阳系数学模型和编程游戏。
但他讨厌住在城市,也讨厌付房租,买了便宜的土地,辞职搬到树林里生活去了。除了找到赚钱的方法,还必须放弃电力,并且必须在食物方面发挥创意,点着煤油灯阅读《科学美国人》杂志。
在开发Apple Writer之前,Lutus还开发了Apple World,你可以设计一座房子,然后让它在屏幕上旋转,类似一个动态屏保。
当时,业余爱好者和计算机极客的市场已经饱和,计算机必须接触到公众,并成为商业工具。哈佛大学学生开发的电子表格软件VisiCalc和Apple Writer是Apple II让人兴奋的重要原因。
1988 年,Lutus驾驶一艘小帆船开始了为期四年的独自环球航行。最近,他将自己的时间分为撰写不同主题的文章和探索阿拉斯加荒野地区的灰熊,以及一个 YouTube 频道,和一系列 Android 应用程序。
对于编程和独居,Lutus强调这样一些事实:
- 大多数独特的现代成就都是个人或非常小的群体的产物,包括相对论、飞机、激光和计算机本身。计算机时代有利于个人。
- 现有的最好的项目都是一个人(最多两个人)的产物,而且一些团队合作实验已被证明是彻底失败。
Arachnophilia是一个流行的Web页面开发环境。在WYSIWYG的Web页面编辑器未出现之前,Lutus的这个开发环境曾是最受欢迎的Web页面编辑器。
资源:如何学习编程并获得开发者工作
因应大流行的居家办公和当下的经济压力,一些人正在考虑从事软件开发工作,这不需要资格证书,是自由职业的好选择。FreeCodeCamp.org 免费提供开源编程课程,它的创始人Quincy Larson在 freeCodeCamp 上免费出版了一本书《How to Learn to Code & Get a Developer Job》,以帮助那些想成为软件开发者的人,并有中文版本《如何学习编程并获得开发者工作》。
行政区划数据库
2023年全国5级行政区划(省、市、县、镇、村)数据库根据国家统计局2022年公布的全国统计用区划代码和城乡划分代码制作,有CSV和SQL格式。
根据2010 - 2023 年城乡数据对比,乡村数量减少 23%,相应的城镇数量增加 22%。人口从农村进入城镇,城镇化率大幅提升。
阅读
这个冬天,许多人的生活变得混乱和复杂起来,除了拥抱健康,我建议您运动和阅读。特别修补了几篇与阅读相关的文章,推荐给大家:
- 使用calibre构建私有化书库的方案实践:介绍了使用calibre和Calibre-Web构建个人书库的诸多细节,并让群晖NAS在存储和管理电子书方面发挥更大作用;
- 树莓派+calibre创建电子书服务器:也是关于calibre和Calibre-Web的应用,但是搭建在树莓派中;
- 电子书工具:介绍制作、管理和阅读电子书的工具,我常使用Kindle、海信A9、盛大锦书(Bambook)和医用显示器/正屏显示器等特种电脑显示器阅读电子书;
- 三大在线公共电子书平台,首推OCA:实际上国人都不常使用这三大平台,我知道您已经有更多的办法。
- 2023 年的全球书单,包括《纽约时报》、《华盛顿邮报》、《经济学人》、《时代周刊》、《出版商周刊》等著名媒体发布的最佳图书清单。
- 免费电子书资源:免费电子书资源主要有(1)公共领域的图书、(2)授权图书和(3)版权不清的书籍分享。
工具:Readwise
很难说Readwise是一个阅读软件还是学习软件。用户通过Readwise重新访问电子书和文章亮点并从中学习,使用基于经过科学验证的学习技术,包含主动回忆(Active Recall)和间隔重复(Spaced Repetition)算法Mastery。
主动回忆是我们挑战大脑以检索一条信息而不是被动地回顾或重新阅读相同信息的过程。
我们很快就会忘记几乎所有读过的内容。学得更多的关键是少忘记。减少遗忘的关键是系统回顾。而最好的复习方式就是通过主动回忆。Readwise 使您能够轻松地将要点转换为两种形式的主动回忆:完形填空和自定义问答。
间隔重复是一种根据旨在优化有限复习时间的算法来间隔复习以前学过的材料的技术。在具体使用中,Readwise 的间隔重复算法(Mastery)看起来就像抽认卡(Flashcards),Readwise也类似于 Anki 或 SuperMemo 等间隔重复软件(SRS)。
进行间隔重复的一个简单方法是使用整理成盒子的抽认卡。制定一个时间表,规定何时修改盒子中每个部分中的卡片。如果您正确回答一张卡片,则可以将其放入您以后不会经常访问的部分,而如果您回答错误,则可以将该卡片移至安排经常访问的部分。Mastery的核心反馈操作是调节这个时间表。
Readwise 快速同步 Kindle、Instapaper、Pocket、iBooks、Twitter、Medium、Goodreads 甚至纸质书籍中的精彩内容。然后开始使用应用程序和每日电子邮件养成每日查看的习惯。通过每天回顾你的精彩片段,你会记住更多的内容,并且最终不会忘记刚刚读完的书中的所有细节,进而同步到Evernote、Notion、Roam等笔记工具作为输出。
Roam Around
Roam Around是一个智能旅行助手,由ChatGPT提供支持,输入目的地,点击生成,即可生成一份目的地旅游建议,将旅行规划的压力转化为乐趣。
这是一个有趣的尝试,但我不经常介绍人工智能模型的套壳应用,过去一年中写入周刊的一些项目已消失,链接已腐烂。
按照风险投资家James Wang的说法,他们基本上将一些生成式 AI 的 API 粘合在一起,进行一些提示性工程,并在其上添加前端用户界面。因此当OpenAI公布新的 GPT-4 Turbo 模型时,有人惊呼 OpenAI 在 45 分钟内扼杀了整个市场,因为用户不再需要那些套壳应用。人工智能的核心技术是算力、算法和数据,因此像NVIDIA、Alphabet(Google)、OpenAI、Microsoft一类的企业才会创造利润,并将价值累积到社会中。
没有算力、算法和数据资源的人怎么变现呢?至少中国市场很有趣,比如您会发现以下这些项目,都是内容农场的路子:用 AI 爬虫做一个网站;用 AI 写公众号热文;用 AI 制作小红书美图;用 AI 批量生产短视频……可以肯定地说,在本来供不应求的内容市场,人工智能加持将获得更为丰厚的回报。
在看起来最为复杂的视频领域,合成媒体技术使视频制作变得简单直观,企业人工智能视频创作平台 Synthesia 在几分钟内就可以制作出培训和营销视频。还有更多平民化的办法。MoneyPrinter 使用 MoviePy(一个用于视频编辑的 Python 库)自动创建 YouTube Shorts;MoneyPrinterPlus 则基于 MoneyPrinter 进一步精心改造,支持众多模型,自动批量混剪,一键批量生成,自动全平台发布。可怜沉迷短视频的群体怎么面对“眼见为实”的牴牾。
miniPaint
miniPaint是一个开源的在线图像编辑器,允许使用 HTML5 技术创建、编辑图像,直接在浏览器中运行(原版和中文化)。
影像:红杉谷的初冬
红杉谷的全年四季都是有花有果的,其中有两张照片是柠檬,您认出来了吗?
👍
「圆周率文化是个人站点,重点分享科技、商业、医学及人文资讯。
「圆周率文化得到中国汽车绞盘网的支持,深表感谢。中国汽车绞盘网业务始创于2001年,为越野车、清障车、消防车、军用车、特种车及工程应用等拖曳、救援场景提供手动绞盘、电动绞盘、液压绞盘和技术支持。