安爸-超级家庭
bg

AI进家庭

Neuronpedia:开源的神经元可解释性平台

Neuronpedia:开源的神经元可解释性平台,为AI模型的神经元研究提供一站式解决方案。亮点:1. 支持多种AI模型和数据集,涵盖GPT2、Gemma等;2. 提供丰富的可视化功能,如激活测试、特征搜索等;3. 开源架构,可自定义扩展,满足个性化研究需求。 参考文献: [1] http://github.com/hijohnnylin/neuron...

阅读:8 评论:0

VecSetX:基于VecSet框架的先进向量集合表示方法

VecSetX:基于VecSet框架的先进向量集合表示方法,为3D点云处理和生成任务提供高效、灵活的解决方案。亮点: 采用24层、1024通道注意力机制,大幅提升模型性能; 引入SDF回归代替传统分类,精度更高; 使用Flash Attention加速训练,效率提升显著。 参考文献: [1] http://github.com/1zb/VecSetX...

阅读:9 评论:0

每日操作系统探索系列已经更新到70天

每日操作系统探索系列已经更新到70天,内容也越来越深了。 参考文献: [1] https://mohitmishra786.github.io/exploring-os/src/ (文:NLP工程化) 每日操作系统探索系列已经更新到70天最先出现在每时AI。

阅读:8 评论:0

反击DeepSeek失败!Llama 4效果不好,Meta承认有问题

今天凌晨1点半,Meta生成式AI领导者Ahmad Al-Dahle在社交平台发布了一篇长文,对前天刚开源的Llama 4质疑进行了官方回应。 Ahmad表示,Llama 4一开发完就发布了,所以,不同服务中模型质量难免会有一些差异。Meta很快会修复这些漏洞提升性能。同时否认在测试集上进行了预训练。 但Meta在官网发布时特意点名DeepSeek,说他们新...

阅读:8 评论:0

炸裂!AI大模型彻底爆了!!

2025开年,AI技术打得火热,正在改变程序员的职业命运: 阿里云核心业务全部接入Agent体系; 字节跳动30%后端岗位要求大模型开发能力; 腾讯、京东、百度开放招聘技术岗,80%与AI相关…… 大模型正在重构技术开发范式,传统CRUD开发模式正在被AI原生应用取代! 最残忍的是,业务面临转型,领导要求用RAG优化知识库检索,你不会;带AI团队,微调大模型...

阅读:11 评论:0

上海交通大学发布“明岐”多模态大模型 突破消化道罕见病诊断瓶颈

在“健康中国2030″战略指引下,上海交通大学于3月29日成功举办“AI赋能精准诊疗创新发展学术会议”。会议由该校计算机学院、国际与公共事务学院及健康长三角研究院联合承办,汇聚政府机构、医疗机构、科研院所及产业界近200位代表,围绕“可信智能·精准诊疗”展开深度研讨。会上首次发布具备消化道罕见病精准诊断能力的多模态大模型矩阵“明岐”。 该模型由上海交大计算...

阅读:9 评论:0

阿里开源R1-Omni,多模态情感识别

阿里巴巴通义实验室的研究人员开源了多模态情感识别模型R1-Omni,并首次将强化学习与可验证奖励应用在多模态大模型,显著提升了模型在情感识别任务中的推理能力、准确性和泛化能力。 根据测试数据显示R1-Omni的识别能力非常优秀,在MAFW数据集上,R1-Omni模型的加权平均召回率达到了40.04%,无加权平均召回率达到了57.68%;在DFEW数据集上,W...

阅读:7 评论:0

“充电厂商”为何跨界AI眼镜?对话闪极创始人张波

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI AI眼镜,究竟为什么这么热? 自2023年10月Meta旗下的Ray-Ban Meta智能眼镜发布,标志着智能眼镜终端不再只是极客的玩具,而是可能成为继智能手机之后,人类与数字世界交互的下一个核心入口。 截至目前,国内已有十余家厂商正式发布了AI眼镜产品,还有更多的产品正等待亮相,“百镜大战”的序幕已经...

阅读:8 评论:0

Llama 4 详细评测:开源模型的全面倒退?

“Llama 4 是开源模型的全面倒退。”——在Meta发布新一代大模型不到24小时内,这样的质疑声音已经出现在多个技术社区。 Llama 4 真的不如前代?还是它只是“看起来拉胯、实则有料”? 昨天,Meta正式推出新一代开源大模型 Llama 4,带来了两个混合专家(MoE)架构的版本:Scout(109B总参数,17B活跃参数)和 Maverick(...

阅读:10 评论:0

AI 圈今年最大丑闻曝光!Llama 4 被揭训练作弊,实测惨遭滑铁卢,核心骨干愤然离职

昨天,Meta Llama 4 就这么突然地发布了。 纸面参数很高大上,号称原生多模态 MOE 模型,击败 DeepSeek V3,还有 2 万亿参数巨兽,连 Meta CEO 扎克伯格也发视频,摇旗高呼迎接「Llama 4 日」。 欢呼是短暂的,当网友开始实测后,却几乎是一边倒的负面评价,堪称今年 AI 界最大的「翻车」事件。 在专门讨论本地部署大语言模...

阅读:10 评论:0