Runway发布Gen-4.5视频生成模型,增强物理与视觉精度#
Runway发布Gen-4.5视频生成模型,增强物理与视觉精度-歸藏(guizang.ai)
Runway推出了新一代视频生成模型Gen-4.5,其主要改进包括提升了物理与视觉精度,支持更复杂的场景和详细构图,提高了物理准确性,能生成富有表现力的角色,并优化了风格化与风格一致性,使其能生成更具电影感和真实日常感的场景。
DeepSeek V3.2正式版发布:强化Agent能力并融入Claude Code思考推理#
DeepSeek V3.2正式版发布:强化Agent能力并融入Claude Code思考推理-Orange AI
DeepSeek正式发布了V3.2版本,重点强化了其Agent能力并深度融入了思考推理机制,特别优化了对Claude Code思考模式的支持,为国内用户使用Claude Code提供了新的便捷途径。
HuggingFace发布Transformers v5首个发布候选版本,实现生态系统互操作性#
HuggingFace发布Transformers v5首个发布候选版本,实现生态系统互操作性-merve
HuggingFace的Transformers库发布了v5的第一个发布候选版本(RC),旨在实现与生态系统中其他工具的端到端互操作性,预示着AI模型开发和部署将拥有更强大的兼容性和灵活性。
Nano Banana Pro 展示对热门IP“黑神话悟空”和“赛博朋克2077”的图像生成能力#
Nano Banana Pro 展示对热门IP“黑神话悟空”和“赛博朋克2077”的图像生成能力-歸藏(guizang.ai)
Nano Banana Pro展示了其在图像生成方面的强大能力,可以创作出《黑神话悟空》等热门IP内容,以及《赛博朋克2077》风格的“knolling”图像。这表明该模型的训练数据可能非常新,并且在处理复杂概念和特定美学风格上表现出色。
国产AI视频生成App内测:音画同步但画面抽象,适合鬼畜视频#
国产AI视频生成App内测:音画同步但画面抽象,适合鬼畜视频-向阳乔木
一款正在内测的国产AI视频生成App,实现了音画同步功能,但在视频内容生成方面表现得“过于抽象”。有用户指出,目前该App的生成效果可能更适合用于制作鬼畜视频,暗示其在生成写实或高质量视频方面仍有改进空间。
Google TPU对英伟达的潜在威胁:Anthropic算力结构变化示意#
Google TPU对英伟达的潜在威胁:Anthropic算力结构变化示意-宝玉
一张图表揭示了Anthropic(Claude的开发公司)在2024年第一季度至2025年第三季度期间,其算力(FLOPs)来源的结构性变化。数据显示,Google TPU在Anthropic的算力构成中占比显著上升,表明其对英伟达GPU的主导地位构成了潜在威胁,预示着AI算力市场竞争日趋激烈。
NeurIPS大会采纳Agentic Reviewer,AI智能体在学术审阅中展现巨大潜力#
NeurIPS大会采纳Agentic Reviewer,AI智能体在学术审阅中展现巨大潜力-Andrew Ng
NeurIPS大会今年收到了创纪录的21,575篇论文提交。上周发布的Agentic Reviewer已超越这一数字,表明AI智能体在论文提交和审阅方面显示出巨大潜力。Andrew Ng指出,智能体论文审阅将持续存在并产生深远影响,预示着AI在学术界效率提升中的重要作用。
OpenBMB正式开源InfLLM-V2的训练数据与基础模型#
OpenBMB正式开源InfLLM-V2的训练数据与基础模型-clem 🤗
OpenBMB团队正式宣布开源其InfLLM-V2的训练数据和基础模型。此举旨在邀请全球社区下载、研究并在此基础上进行创新,促进大语言模型领域的开放合作与技术发展。
Trinity:开放权重MoE(混合专家)家族的全新起点#
Trinity:开放权重MoE(混合专家)家族的全新起点-clem 🤗
Trinity项目正式亮相,被定位为一个开放权重(open-weight)MoE(混合专家)家族的起点。该项目旨在为企业和开发者提供可自主拥有的模型,推动MoE架构在商业和开发领域的应用和创新。
DeepMind联合创始人Demis Hassabis赞扬AlphaFold对生物医学研究的巨大影响#
DeepMind联合创始人Demis Hassabis赞扬AlphaFold对生物医学研究的巨大影响-Demis Hassabis
DeepMind联合创始人Demis Hassabis高度赞扬了《财富》杂志关于AlphaFold的文章,强调了该AI系统对生物和生物医学研究产生的巨大影响。AlphaFold在蛋白质结构预测方面的突破,持续推动着生命科学领域的发现与进步。