开云体育

一周AI大事:神秘生图AI一夜封开云体育神Deepseek带飞国产芯片

2025-09-01
浏览次数:
返回列表

  开云体育[永久网址:363050.com]成立于2022年在中国,是华人市场最大的线上娱乐服务供应商而且是亚洲最大的在线娱乐博彩公司之一。包括开云、开云棋牌、开云彩票、开云电竞、开云电子、全球各地赛事、动画直播、视频直播等服务。开云体育,开云体育官方,开云app下载,开云体育靠谱吗,开云官网,欢迎注册体验!NanoBanana是一款新发布的AI图像生成模型,在LMArena平台上一经亮相,便因其出色的图像编辑效果而迅速走红,引发热烈反响。NanoBanana具备直观的自然语言控制功能和高保真编辑能力,能够根据用户提示精确修改图像,比如添加或移除物体、更换背景、应用各种艺术风格,还能生成或精修人像。

  从技术层面看,NanoBanana模型似乎在底层采用了基于体积或神经场的实体建模技术,从而在编辑过程中保持空间与风格的一致性。这使得它成为一款具备Photoshop级别编辑能力的AI提示词驱动工具,既能保留真实图像中的既有元素,又能无缝添加逼真元素。

  外界普遍认为NanoBanana是谷歌的下一代Imagen模型,但谷歌官方唯一的确认是公司员工洛根·基尔帕特里克(Logan Kilpatrick)在社交媒体X上发了一个香蕉表情符号。X平台上也有人声称NanoBanana模型来自Higgsfield公司,但目前尚无官方消息。目前LMArena上线的NanoBanana仍是有限的公开预览,此外,NanoBanana也已上线了Dzine等其他一些图像生成平台。

  无独有偶,阿里巴巴的通义千问团队也发布了开源图像编辑模型Qwen-Image Edit,该模型能够通过文本提示实现类似Photoshop的图像编辑。Qwen-Image Edit基于近期发布的Qwen-Image模型构建,既能处理广泛的语义转换,也能进行精细的外观更改,并支持中英文。该模型已在Hugging Face上线,也可通过通义千问(QwenChat)的API使用。

  锐评:神秘的NanoBanana和阿里的Qwen争相上岗,以后“眼见为实”可能要成为历史了。

  二、AI技术与产品发布——字节、英伟达、谷歌齐发力,大模型迎来“内卷”新高潮

  1. 新闻:深度求索(DeepSeek)发布DeepSeek-V3.1。这款混合思维模型拥有更高效的推理能力、更强的搜索推理能力以及更出色的工具调用和智能体能力。其混合思维模式可以在“思考”和“非思考”模式间切换,从而优化性能和效率。该模型性能大幅领先深度求索前代R1模型,同时使用的“思考”词元(token)更少。例如,DeepSeek-V3.1在SWE-Bench测试中的得分率为66%,Aider Polyglot测试得分率为76%。 DeepSeek-V3.1是一款开源的混合专家模型(MoE),总参数量6710亿,激活参数量为370亿,上下文长度为128K。模型还采用FP8精度格式进行了优化,暗示未来有望大规模使用国产芯片,受此影响,国产芯片股价在周五暴涨。目前,DeepSeek-V3.1-Base和DeepSeek-V3.1均已在HuggingFace上线。

  锐评:深度求索的新模型不仅学会了“劳逸结合”,还特意为国产芯片“穿上了合脚的鞋”。

  2. 新闻:字节跳动Seed团队发布Seed OSS 36B。这是一组由三个开源360亿参数稠密模型组成的产品,包括两个基础变体(一个使用合成数据,一个未使用)和一个指令微调模型。这些模型基于12万亿词元进行训练,专为长上下文(原生支持50万词元)和智能体应用而设计。它们还包含一个可以512个词元为增量进行设置的“思考预算”控制功能,让用户能在推理深度和速度之间进行权衡。

  3. 新闻:英伟达发布Nemotron Nano 9B V2。这是一款运行速度很快的90亿参数混合架构(Mamba-Transformer混合体)AI模型,其完全开源,包括基础版、预对齐/剪枝版以及一个经过重新对aligned的推理模型。其训练数据也高度透明,包含约6.6万亿词元,涵盖网页、数学、代码和监督式微调数据。Nemotron Nano 2技术报告也已发布,有助于开发者复现和微调。

  4. 新闻:谷歌为Pixel 10和安卓系统推出重大Gemini升级。这些升级包括“Gemini Live”视觉指导功能,允许AI助手通过摄像头“看见”并实时指导用户完成拍摄任务;此外还有实时翻译和Gemini驱动的照片编辑功能。Pixel 10系列智能手机将于8月28日上市,后续相关AI功能将推广到其他安卓和iOS设备。

  5. 新闻:谷歌正在将搜索服务中的“AI模式”向全球新增的180个国家和地区推广。“AI模式”现已为Ultra订阅用户增加预订餐厅的智能体功能,并能根据用户偏好提供个性化的搜索结果。

  6. 新闻:谷歌宣布增强Drive的视频编辑体验,为旗下AI视频创作工具Vids增设了快捷按钮。Workspace用户现在可直接将Drive中的视频在Vids中打开,并进行剪辑、添加音乐和文字。

  7. 新闻:Cohere发布Command A Reasoning。这是一款新的企业级大语言模型,支持25.6万词元的上下文和23种语言,具备强大的推理和工具使用能力。Command A Reasoning现已商用,其提供的“词元预算”功能可用于定制推理深度。用户可通过 Cohere North平台进行安全部署。

  8. 新闻:VAST旗下AI 3D大模型发布Tripo 3.0版本。在AI 3D模型算法层面,VAST先后推出Tripo1.0至Tripo2.5等数十亿参数的3D大模型,而Tripo3.0的参数量将直接提升到200亿,并且采用全新的技术路线和“表达形式”TripoSF中的SparseFlex,大幅提升模型的分辨率和效率,让3D生成迈入IMAX新时代。

  9. 新闻:OpenAI推出Agents.md。这是一个基于Markdown的开源标准,用于直接在代码仓库的根目录中记录智能体配置、指令和设置。Agents.md格式旨在标准化智能体配置生态系统(包括 MCP 服务器清单、工具模式定义、系统指南等),让各种工具能够自动检测并使用已记录的指令。这一标准似乎正得到广泛采纳,目前已被OpenAI Codex、Amp、Jules、Cursor、RooCode等多个平台采用。

  OpenAI发表题为《加速生命科学研究》(Accelerating life sciences research)的文章,介绍其AI模型如何支持生物学研究。他们分享了如何利用专为蛋白质工程优化的GPT-4o衍生版本GPT-4b micro,在干细胞重编程研究中成功地引导蛋白质设计,该技术有望应用于细胞再生疗法。

  OpenAI首席财务官萨拉·弗莱尔(Sarah Friar)在一档直播节目中透露,OpenAI将考虑在未来某个时间点上市。弗莱尔表示,即便在营收方面不断创下里程碑,公司仍然面临人工智能算力短缺的持续压力。“目前对GPU和算力的需求极为旺盛。”她在接受采访时说,“我们面临的最大挑战就是一直处于算力不足的状态。这就是我们为什么推出’星际之门’、为什么进行更大规模基础设施建设的原因。”她还强调,微软在未来“数年”都将是重要合作伙伴。

  Coinbase首席执行官布莱恩·阿姆斯特朗(Brian Armstrong)解雇了拒绝使用 GitHub Copilot等AI编程助手的工程师。阿姆斯特朗在全公司范围内发布强制命令,并为不遵守规定的员工召开了一次会议。那些没有正当理由拒绝使用AI编程助手的员工被解雇,这明确传达了强制采用AI的信息。

  机器人初创公司FieldAI已融资4.05亿美元,其中包括最近由贝索斯个人风险投资基金Bezos Expeditions共同领投的3.14亿美元。该公司开发的“具身智能基础模型”本质上就是“机器人大脑”,能帮助各种机器人安全适应新环境。这些模型融合了物理学原理,使机器人能够在新环境中快速学习、管理风险并做出可靠决策。

  AI怀疑论者们议论纷纷,诸如《麻省理工学院报告:企业中95%的生成式AI试点项目宣告失败》等标题频频见诸报端。然而实际上,这项研究本身存在缺陷且范围有限,也并未直接断言95%的AI试点项目失败,而是指出AI投资的回报尚未实现。科技媒体VentureBeat解释说,企业AI并未失败,而是在通过“影子AI”悄然成功。这项研究实际上发现,AI的大部分“价值”都体现在作为私人工具使用的个体身上。

  有观点认为,GPT-5的发布显然“搞砸了”。连萨姆·奥特曼(Sam Altman)自己也说OpenAI“彻底搞砸了”GPT-5的发布。急于给AI炒作降温、鼓吹AI失败悲观论调的AI怀疑论者之一尤恩·莫里森(Ewan Morrison)这样描述论调的转变:两周前说AGI要来了; 一周前说GPT-5不是AGI,是个失败品。 这周说我们正处在AI泡沫中。

  但也有不少人认为,这种情绪波动只是AI炒作周期的季节性表现。在去年和前年的8月份,都曾出现类似的沉寂和对AI进展的质疑。2023年8月,当AI发展看似停滞时,曾有人发问“AI的夏天结束了吗”,结果不到一个月就迎来了多模态的GPT-4。去年8月份,也出现“模型规模化是否已经见顶”的讨论,结果o1模型在2024年9月份横空出世。所以,这一切也终将过去。

  OpenAI首席执行官萨姆·奥特曼(Sam Altman)在公开场合表示,人工智能时代“或许是开启职业生涯最令人激动的时刻,可能有史以来皆是如此”。奥特曼认为,人工智能正以前所未有的速度改变着职场生态。它不仅能够催生新的产业和职位类型,还能显著提升劳动者学习和掌握新技能的能力。在科技、科学和媒体等前沿领域,人工智能工具正成为年轻劳动者,尤其是创业者的得力助手。微软联合创始人比尔·盖茨(Bill Gates)也表达了类似观点。他认为,人工智能将提高人们的工作效率,让人们从繁琐的任务中解脱出来,专注于更有价值的工作。

  微软AI业务主管穆斯塔法·苏莱曼(Mustafa Suleyman)将一项关于“AI福祉”的研究称为危险之举。他担心这会加剧人类现有问题并制造社会分裂。在一篇题为《我们必须为人类构建AI,而不是让AI成为人》的博客文章中,苏莱曼认为,倡导AI权利和“模型福利”是一种误导,也是一个危险的转向,可能会扭曲公众对AI的理解。他强调,AI 应该被视为工具而非生命体,并警告拟人化带来的风险。

搜索