热门平台 · 点击切换
查看更多平台 (15个)

51CTO热榜

21
玻璃里跑AI!华中科大&上交大科研成果登Nature子刊
从2023年底构想这个方向,到芯片制造、实验验证、论文发表,将近两年半。团队的判断是:光计算最大的潜力,藏在第三个维度里。...
22
ABot-OCR 2B创新打法,赶超MinerU2.5
很多 OCR 工作会把重点放在模型架构创新上,但 ABot-OCR 的主线其实更偏“系统工程”:先把数据可信度做厚,再把训练目标做清晰,最后用约束型 RL 修结构。...
23
MiMo V2.5 全系大降价后,我发现 AI 行业变天了!
最近几年一直尝试用ai来辅助自己编程,vibe coding、龙虾、codex/claude啥的也都玩过,随着今年agent这种模式越来越火。Agent这种多轮循环调用的模式,消耗的 Token 简直...
24
Claude 4.8炸场!部分能力超过Mythos,支持数百子智能体并行
公告称Opus 4.8最显著的改进是诚实性。AI的一大问题是会草率下结论,即使证据不足,也会自信地声称取得了进展。但Opus 4.8更有可能标记出其工作中的不确定性,并且不太可能做出未经证实的断言。...
25
AI 导购在 vivo 官网的落地实践
本文介绍AI导购技术在 vivo 官网 APP 的落地实践,通过定义解决问题的边界能力、搭建多层架构方案、方案落地这三大块内容逐步递进地展开 AI 导购在为用户服务的应用过程。...
26
机器心理测量学:人工智能的数学心理学
Evolutionairy AI 技术团队把这种盲区称为“性能与心理的断层”。AI 的行为已经复杂到足以影响人类的信任、情绪、决策,但我们却没有一套像心理学那样的工具去理解它的行为结构。...
27
当智能体学会站在用户脑子里思考,ToM 推理被彻底改写
尽管 UserHarness 的表现非常亮眼,但它并不是万能的。它在高阶嵌套信念上仍然存在困难。尤其是 Hi-ToM 里 order 大于等于二的任务。递归深度越高,心智轨迹越复杂,模型越容易在 ne...
28
Anthropic发布Claude Opus 4.8:价格不变,Agent能力反超GPT-5.5
Claude Opus 4.8今天已经全渠道可用,常规使用价格和Opus 4.7保持一致:每百万输入token 5美元,每百万输出token 25美元。快mode价格是每百万输入token 10美元,...
29
Claude Code 完全指南:从 Slash Commands 到 Skills 的演进
Slash Commands 正是为了解决这个问题而诞生的。表面上看,它们只是以 / 开头的命令,但其背后其实是一个带有一组 workflow 约定的具名任务入口。这也是本文将继续探讨的主题。...
30
自定义命令与 Skills 工程化实战:OpenSpec 契约与团队编排 SOP
这篇文章会带你从 0 到 1 搭一套可落地的团队工作流(编排 skill )。 读完后,你应该能在自己的项目里做出一套最小可用版本,并逐步扩展成团队级 AI 交付系统(这个我不确定是否好用)。...
31
拆解 Claude Code 的 Harness 工程
Agent就是大模型本身——它天生会推理、会决策。你要做的不是"开发"它,而是给它搭一个能干活的环境:能用什么工具、能看什么文件、边界在哪、怎么跟别人协作。这个环境就叫 Harness。...
32
三个月 53k 星:Matt Pocock 这 17 个 skill,我拿一个真业务跑了一遍
我用 Claude Code 工作有一段时间了,该踩的坑都踩过一遍,还是没把这件事想透。上周看到 Matt Pocock 把他 ​​.claude​​ 目录里的 17 个 skill 全开源了,rep...
33
自迭代训练的“对齐衰减”:当AI学会不再做我们想让它做的事
本文将从现象出发,深入到对齐衰减的三大驱动机制,继而呈现前沿模型中的实证证据,再审视当前缓解措施的有效性与局限,最终探讨这一问题的根本性质。...
34
Vue3 中没有了 .native 修饰符,组件原生 DOM 事件该如何监听?
在Vue2中,为了区分自定义事件和原生DOM事件,我们需要使用.native修饰符来明确表示我们要监听的是原生DOM事件。但在Vue3中,这一机制发生了变化,让我们一起来了解一下。...
35
搞懂 I2C 设备驱动开发,才算真正吃透嵌入式 Linux 内核驱动
其实Linux I2C框架本质就两件事:控制器驱动和设备驱动,把这俩拆开理解,就很清晰明了了。...
36
html2canvas 淘汰!Chrome 全新高性能 Canvas API 发布!
传统 html2canvas、SVG foreignObject 均为临时hack,存在静态无交互、性能差、隐私隐患等问题,无法兼顾开发效率与渲染能力。而 WICG 推出的 HTML-in-Canva...
37
一文读懂元数据、语义、分类、本体、知识图谱和上下文究竟是什么
在这篇文章中,我将用具体的例子来阐释上下文概念背后的原理,这也是我希望更多人能做到的。最后,我会分享自己关于如何构建上下文层的看法。...
38
Skills 的五种架构设计模式
本文基于 OpenAI、Google Labs、Trail of Bits 等 7 个顶级 Skill 仓库的深度分析,提炼出 5 种经过验证的设计模式与一套通用写作方法论,帮助你在企业级 Agent...
39
小红书多媒体任务调度系统的演进优化
本文系统梳理了从 Netflix Conductor 改造而来的第一代调度系统 RedProcess,到面向下一阶段业务规模自研的新一代调度引擎 DES 的演进历程,重点介绍在性能、可用性、功能完备性...
40
Agentic AI 带来的业务流程变革
Agentic AI 的核心在于赋予机器自主感知环境、独立思考、制订计划、执行复杂任务并从结果中学习的能力,这种自主性将深刻影响企业业务流程的各个层面。...
共 50 条热点 | 数据来源: 51CTO
最近访问 (100)
ie123
20:55