安爸-超级家庭
bg

AI进家庭

OpenAI 开源gpt-oss权重,Huggingface开源微调gpt-oss权重方法

**关注我,记得标星不迷路哦~ 1: gpt-oss 开放权重推理与智能体模型 OpenAI的gpt-oss项目发布了gpt-oss-120b和gpt-oss-20b两款开放权重模型,它们主要面向强大的推理、代理任务以及多用途开发者应用场景。这些模型采用Apache 2.0许可证,支持根据需求配置推理工作量,并提供完整的思维链以增强调试和输出可信度。项...

阅读:10 评论:0

阿里开源Qwen-Image,AI会写汉字了!

阿里开源Qwen-Image,已经成为huggingface排名第一。 亲测12G的3060可用! Qwen-Image 是一个拥有 20B 参数的 MMDiT(多模态扩散变换器)模型,基于 Apache 2.0 许可证开源。 Qwen-Image 是阿里巴巴通义千问团队发布的首个图像生成基础模型,这是一个拥有 20B 参数的 MMDiT(多模态扩散变换器...

阅读:11 评论:0

OpenAI时隔6年再度开源!两款推理模型,o4-mini级,手机和笔记本能跑

一手实测速度惊人,网友吐槽开源不彻底。 作者 | 陈骏达 编辑 | 李水青 时隔6年,OpenAI再次开源语言模型! 智东西8月6日报道,今天,OpenAI终于放出其传闻已久的开源模型:gpt-oss-120b和gpt-oss-20b。这两款模型均采用MoE架构,与DeepSeek的多款模型类似。 本次OpenAI开源的模型最大亮点之一是其部署的高...

阅读:14 评论:0

Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

明敏 发自 凹非寺 量子位 | 公众号 QbitAI 还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。 但加量不加价,定价和Claude Opus 4一样。 官方说计划在未来几周对模型进行更大规模升级与改进,看...

阅读:12 评论:0

御三家打起来了:OpenAI 开源、谷歌发布可交互的世界模型、Claude 4.1 成了编程新旗舰

同一天,硅谷模型三巨头连续发布了新的模型(到底也不知道谁截胡谁了)。 OpenAI 终于发布了新的开源模型,gpt-oss-120b 和 gpt-oss-20b,上次开源 GPT-2 已经是 6 年前的事情了。从目前的评测成绩来看,两款模型能力接近 o4-mini,虽然编程能力略弱,但这个 SOTA 级别的能力表现,很期待接下来的开源生态的发展。 Deep...

阅读:20 评论:0

1句话生成可玩的3D世界!谷歌Genie3震圈登场,世界模型终于迎来ChatGPT时刻

3D世界支持实时操控、边玩边改,Sora负责人也参与了。 编译 | 程茜 编辑 | 李水青 智东西8月6日消息,昨夜,谷歌DeepMind宣布推出通用世界模型Genie 3,首个可实时交互世界模型来了。 基于文本提示,Genie 3可以允许用户以每秒24帧的速度,以720p的分辨率生成长达数分钟的交互式3D环境,Genie 2仅能生成10到20秒。...

阅读:14 评论:0

谷歌“世界模拟器”深夜上线!一句话生成3D世界,支持分钟级超长记忆

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 只需一句话,就能生成可实时交互的3D世界。 刚刚,谷歌DeepMind发布了新一代通用世界模型Genie 3。 性能上,Genie 3相比上一代大幅升级,支持720P画质,每秒24帧实时导航,以及分钟级的一致性保持。 前DeepMind科学家、AI 3D生成创业者Tejas Kulkarni受邀体验...

阅读:12 评论:0

谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒

新智元报道 编辑:桃子 好困 【新智元导读】老黄曾预言,每个像素都将由AI生成!刚刚,谷歌DeepMind放出的「通用世界模型」Genie 3,一句话即生720p实时模拟世界,1分钟视觉记忆一致性超高。 全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 一句...

阅读:12 评论:0

AI混战日:OpenAI开源、Claude发最强coding模型、Google惊艳的世界模型也亮相

硅谷最重要的三家模型大厂,同一天发布了各自非常具有节点意义的模型。这种混战日有阵子没见到了。 8月5日注定会成为AI技术和商业竞争格局演变里重要的一个时刻。 同一天,Google先扔出了Genie 3模型——一个你可以和模型生成的3D世界实时交互的世界模型。 接着Anthropic直接更新了它最主力的Claude Opus系列,发布Claude 4.1 O...

阅读:12 评论:0

文档处理新革命!Chunkr 专为RAG与知识库场景设计,多格式智能解析!

在构建文档问答、知识库或RAG(检索增强生成)系统时,处理PDF、PPT、Word等复杂文档的格式转换、OCR和结构化提取是一大痛点。 格式转换繁琐、OCR识别不准、结构化处理耗时,这些问题不仅拖慢开发进度,还可能影响AI应用的准确性。 由Lumina AI开发并开源的一款开源文档处理API,利用视觉语言模型(VLM)即可将复杂文档转为RAG/LLM就绪的结...

阅读:12 评论:0