巴比特

2024-11-21 19:21

摘要：随着今年秋天的临近，谷歌和OpenAI的多模态模型之战，也进入到白热化阶段。就在上周，谷歌已经对一些外部公司开放了多模态大模型Gemini的功能。而OpenAI，当然不会坐以待毙。他们正在争分夺秒地把多模态功能整合进GPT-4里，争取推出功能与Gemini类似的多模态大模型，一举击杀谷歌。据外媒The Information爆料，一款名为Gobi的全新多模态大模型，已经在紧锣密鼓地筹备了。OpenAI计划，在Gemini发布之前就推出多模态LLM，彻底击败谷歌。

图片来源：由无界 AI生成

热点资讯：

任正非：我们即将进入第四次工业革命，基础就是大算力

据证券时报 e 公司报道，9 月 19 日，华为创始人兼 CEO 任正非与 ICPC（国际大学生程序设计竞赛）基金会及教练和金牌获得者的学生的谈话纪要曝光，任正非表示，我们即将进入第四次工业革命，基础就是大算力，第四次工业革命波澜壮阔，其规模之大不可想象，今天的年青人是未来大算力时代的领袖，二三十年之内的人工智能革命，一定会看到年青人星光闪耀。

谷歌 Bard 人工智能聊天机器人已支持插件功能

据 IT 之家消息，9 月 19 日，人工智能聊天机器人谷歌 Bard 发布了最新更新，增加了对谷歌应用的插件支持，包括 Gmail、Docs、Drive 等。谷歌表示，这是 Bard 迄今为止功能最强大的版本，可以在全球各种语言和国家中提高协作效率。

除了插件支持外，谷歌 Bard 还增加了一个“公共链接分享”功能，允许用户将自己与 Bard 的对话分享给任何人，他们可以在自己的设备上继续对话。此外，Bard 还可以“复核”自己的答案。每个答案的底部都有一个“G”按钮（代表谷歌），用户可以点击该按钮让 Bard 在谷歌上再次检查自己的回答是否正确。谷歌 Bard 目前已经开放公共预览，用户可以在网上免费体验。

火山引擎数智平台发布 AI 助手

据 36 氪报道，9 月 19 日，火山引擎在其举办的“V-Tech 数据驱动科技峰会”上宣布，火山引擎数智平台 VeDI 推出“AI 助手”，通过接入人工智能大模型，帮助企业提升数据处理和查询分析的效率。目前，VeDI 相关数据产品已启动邀测。

华为云将携手深圳市气象局打造高精度区域气象预报大模型

据深圳特区报报道，9 月 18 日，华为云宣布将联合深圳市气象局，致力于打造区域气象预报大模型，探索强降水等气象要素预报新技术，提供深圳及周边区域高分辨率中短期气象预报产品。该区域气象大模型将利用人工智能技术提升中短期强降水等气象要素预报精度和模型运算速度，对大城市气象灾害预警和防灾减灾有着积极意义。

OpenAI 计划赶在谷歌 Gemini 发布前抢发多模态大模型

据《科创板日报》援引 The Information 报道，OpenAI 正在积极努力将多模态功能（类似于谷歌 Gemini 预计提供的功能）纳入 GPT-4，目标赶在 Gemini 发布前推出多模态大型语言模型（MLLM），即代号为 Gobi 的下一代大型语言模型，以击败谷歌并保持领先地位。OpenAI 早在 3 月份发布 GPT-4 时就预先展示了 Gobi 的功能，但除了一家名为“Be My Eyes”的公司外，没有向其他公司开放。后者主要为有视力障碍或失明的人开发移动应用程序。

甲骨文发布语音生成式 AI 助手，助力医疗保健领域

据站长之家 9 月 19 日报道，美国商用软件巨头甲骨文（Oracle）在其年度健康大会上宣布推出一款语音生成式人工智能助手，旨在改善医疗保健领域的临床工作流程。这款助手将整合到甲骨文的电子健康记录（EHR）解决方案中，以帮助医护人员自动化管理医疗记录和提高患者护理质量。甲骨文表示，这对于正在面临人员短缺问题的医疗团队尤其有用，而据预测，到 2030 年，预计将缺少 1800 万医护工作者。此外，这款助手还可以提供患者更好的自助服务体验。甲骨文计划在未来 12 个月内全面推出此助手，以改善医护工作流程和提供更多服务。此前报道，甲骨文今年将斥资数十亿美元购买英伟达 GPU，大举押注 AI。

微软 AI 团队意外泄露包含 3 万多条内部信息在内的大量数据

据金十 9 月 19 日报道，云安全公司 Wiz 最新研究显示，微软（MSFT.O）人工智能研究团队意外泄露了在软件开发平台 GitHub 上的大量私人数据缓存。该团队在发布开源训练数据时，链接配置错误导致数据泄露。存储库用户本只被允许从云存储链接下载人工智能模型，但链接权限被错误地配置，这意味着其他人可以删除和覆盖现有文件。Wiz 表示，泄露的数据包括微软员工的个人电脑备份，其中包含微软服务的密码、密钥以及 359 名微软员工的 3 万多条微软 Teams 内部信息。

微软 Win11 画图有望引入 AI 生成图像功能，基于 DALL-E

据 IT 之家 9 月 19 日报道，微软日前面向 Windows 测试人员推出了新版画图应用（Dev/Canary 版本 11.2308.18.0），为大家带来了 Photoshop 的核心功能之一“图层”。除此之外，爆料人 PhantomOcean3 从新版画图的文件中发现，有一段用于新图像生成功能的字符串，该功能被命名为“Cocreator”。

PhantomOcean3 表示，该功能将基于 OpenAI 的 DALL-E，预计会类似必应聊天中使用的 Bing Image Creator 服务。此外，微软将于北京时间 9 月 22 日凌晨 1 点举办硬件发布会，其主题除了 Surface 硬件之外，还会探讨 Win11、Microsoft 365 以及各种 AI 产品，预计将会公布这一项功能。

腾讯云联合信通院发布“金融行业大模型标准”

据站长之家报道，9 月 18 日，腾讯云联合信通院正式发布国内首个金融行业大模型标准。该标准涵盖了金融大模型的关键能力要求，包括场景适配度、能力支持度和应用成熟度三大方面。此外，标准还从金融行业的特性出发，覆盖了投资研究、投资顾问、风险管理、市场营销、客户服务等多个金融应用场景，并详细规定了金融大模型在数据合规性、可追溯性、私有化部署、风险控制等方面的要求。

IBM 承诺到 2026 年底将培训 200 万名 AI 人才

据《科创板日报》9 月 19 日报道，IBM 发布声明称，为帮助缩小全球人工智能 (AI) 技能差距，承诺到 2026 年底将培训 200 万名 AI 人才。IBM 表示，将在现有的 IBM SkillsBuild 平台上增加以 AI 为重点的培训，并将特别面向代表性不足的群体。IBM 称，其新的免费课程将教授生成式 AI 的提示写作、机器学习，以及利用 AI 改善客户服务。

投融资：

AI 初创公司 Writer 完成 1 亿美元融资，估值超过 5 亿美元

据彭博社 9 月 18 日报道，人工智能初创公司 Writer 完成 1 亿美元融资，估值超过 5 亿美元。据悉，Writer 由首席执行官 May Habib 领导，是最新一家在企业环境中使用大型语言模型的 AI 初创公司。该公司可以让其他公司使用人工智能来完成产品描述、职位列表和社交媒体帖子等功能，同时还能分析数据和自动执行任务。

元宇宙荐读：

《最顶尖的大语言模型人才，只关心这10个挑战》

本文探讨了大语言模型（LLM）研究中的十大挑战，作者是Chip Huyen，她毕业于斯坦福大学，现为Claypot AI —— 一个实时机器学习平台的创始人，此前在英伟达、Snorkel AI、Netflix、Primer公司开发机器学习工具。

https://www.8btc.com/article/6833316

《GPT-5来了？OpenAI被曝加急训练多模态大模型Gobi，一举狙杀谷歌Gimini！》

多模态大模型的战场上，已有人闻到风声。据外媒爆料，OpenAI的全新多模态模型Gobi似乎已在筹备中。谷歌和OpenAI的这场对决，似乎已是箭在弦上了。

https://www.8btc.com/article/6833298

《AI在玩一种很新的艺术，700万网友在线围观，ControlNet又立功了》

AI又在玩一种很新的艺术。一组“在离谱与合理的边缘反复试探”的图席卷各大平台，最火的一条????已有近700万查看16.8万点赞，到处有人在求教程。连知名投资机构Y Combinator的创始人Paul Graham都来围观。

https://www.8btc.com/article/6833302

巴比特

最新发布

热点资讯

标签