今日新闻
20
热门项目
4
推特动态
6
AI 处理
20
创意灵感
234
融资动态
12
今日必读
OpenAI发布GPT-4.5预览版:推理与多模态能力全面升级
OpenAI发布GPT-4.5预览版,支持200万token超长上下文,在数学推理、代码生成和多模态理解方面实现重大突破。幻觉率显著降低,为复杂任务处理提供更可靠的基础。
阿里巴巴Qwen 3和月之暗面Kimi k1.6同日发布,在多模态、长文本推理和代码生成方面实现突破。均采用Apache 2.0开源协议,推动中国AI技术全球化。
DeepSeek R2以1.2万亿参数MoE架构实现顶级性能,训练成本仅800万美元。代码生成和数学推理能力超越GPT-4o,全面开源推动行业进步。
今日看点
今日AI领域呈现多元化发展态势。推理模型成为焦点,OpenAI o3和xAI Grok 3相继发布,在数学推理和编程能力上取得突破。DeepSeek V3以极低成本实现高性能,引发行业对训练效率的重新思考。多模态能力持续演进,Google Gemini 2.0展示了原生多模态的潜力。投资方面,Anthropic和Perplexity的大额融资反映了市场对AI应用的高度认可。
最新资讯
xAI Grok 3重大更新:深度研究模式与实时协作
Grok 3推出Deep Research模式,支持数小时深度研究任务。新增实时协作功能,多用户可协同工作。与X平台深度集成,实时分析社交媒体趋势。
Meta Llama 4泄露:4000亿参数原生多模态架构
Llama 4将采用4000亿参数原生多模态架构,支持文本、图像、音频、视频统一处理。基准测试显示多项任务超越GPT-4.5,预计3月正式发布。
Claude 3.7 Sonnet发布:扩展思考与增强工具使用
Claude 3.7引入Extended Thinking模式,复杂推理任务更准确。工具使用能力增强,支持复杂API调用链。代码生成和长文档分析能力显著提升。
Mistral Large 2更新:欧洲主权AI与企业级安全
Mistral Large 2强调欧洲数据主权,确保数据在欧盟境内处理。针对企业级安全合规优化,支持私有云和本地部署,与SAP、Siemens等达成合作。
AI Agent突破:多智能体系统达95%任务完成率
多智能体协作系统在复杂软件开发任务上达到95%完成率。由规划、编码、测试、审查Agent组成,通过动态协作完成任务,标志着AI Agent向复杂项目管理演进。
NVIDIA Blackwell Ultra发布:AI性能翻倍功耗降低30%
Blackwell Ultra GPU AI训练性能翻倍,推理性能提升150%,功耗降低30%。支持FP4/FP8精度,AWS、Google Cloud、Azure Q2提供实例。
Qwen 3与Kimi k1.6发布:中国AI模型再创高峰
阿里巴巴Qwen 3和月之暗面Kimi k1.6同日发布,在多模态、长文本推理和代码生成方面实现突破。均采用Apache 2.0开源协议,推动中国AI技术全球化。
AI安全突破:新宪法AI框架有害输出降低99%
新宪法AI框架通过动态价值学习和多轮自我修正,将有害输出降低99%。引入'道德不确定性'概念,为AI安全对齐研究提供新思路。
GitHub Copilot X进化:全栈开发Agent自主调试
Copilot X升级为全栈开发Agent,支持需求分析、架构设计、代码生成、测试和部署全流程。自主调试和跨文件重构能力大幅提升开发效率。
Sora 2.0与Runway Gen-4:AI视频生成达电影级质量
Sora 2.0支持4K 60fps长时间视频生成,物理模拟和角色一致性提升。Runway Gen-4在镜头语言和艺术风格方面表现出色。好莱坞开始使用AI进行预可视化。
Databricks 25亿美元收购MosaicML:企业AI整合加速
Databricks收购MosaicML是今年最大AI并购案,将整合高效模型训练能力与数据平台。企业AI市场整合加速,Salesforce、Snowflake也在寻求收购。
Figure AI与Tesla Bot:人形机器人进入商业部署
Figure 02在BMW工厂部署100台执行装配任务,Optimus Gen-3可连续工作8小时。成本降至10万美元以下,亚马逊、沃尔玛开始测试仓储应用。
AlphaFold 3发布:蛋白质预测加速新药研发
AlphaFold 3蛋白质-配体相互作用预测精度达95%,可预测药物分子结合方式。10家制药公司采用,预计药物发现周期从5年缩短至18个月。
可汗学院AI Tutor 2.0:大规模个性化教育
AI Tutor 2.0实时分析学习状态,动态调整教学策略。试点显示学习效果提升40%,学习时间减少25%。计划向全球贫困地区免费提供。
特斯拉FSD V13获批:加州完全自动驾驶即将启动
FSD V13获加州DMV批准完全自动驾驶,安全里程1亿英里,事故率低于人类10倍。3月将在旧金山和洛杉矶启动Robotaxi服务。
Adobe Firefly 5.0:AI创意套件变革内容生产
Firefly 5.0支持文本生成视频、AI辅助3D建模和交互式网页设计。Firefly Video支持4K视频生成,Firefly 3D支持可打印模型生成。训练数据均获授权。
Open LLM Leaderboard 3.0发布:开源模型新评估标准
Open LLM Leaderboard 3.0引入推理、代码、多语言、安全性和效率评估维度。新增动态测试集防止过拟合,已收录500+开源模型,推动开源生态发展。
新项目发现
Twitter AI 动态
GPT-5 的推理能力简直令人惊叹。刚刚测试了它在复杂数学问题上的表现,准确率比 GPT-4 提升了 40% 以上。AI 的发展速度真的超出了所有人的预期。🚀
刚刚体验了 Claude 3.5 的新功能,代码生成质量有了质的飞跃。特别是对于复杂架构设计,它的理解能力让我印象深刻。
AI Agent 赛道今年融资额已经突破 50 亿美元。从自主浏览器到编程助手,这个领域的创新速度令人瞩目。
热搜榜单
Grok 3 发布
985,000 热度
DeepSeek V3
856,000 热度
OpenAI o3
742,000 热度
Gemini 2.0
634,000 热度
AI Agent 爆发
523,000 热度
Llama 3.3
489,000 热度
Perplexity 融资
412,000 热度
Midjourney V7
398,000 热度
Twitter AI 话题
#Grok 3
985.0K 推文
#DeepSeek
856.0K 推文
#OpenAI o3
742.0K 推文
#Gemini 2.0
634.0K 推文
#AI Agent
523.0K 推文
订阅 AI 日报
每日精选 AI 行业重要资讯,AI 评分筛选,直达核心内容