安爸 - 安爸-超级家庭

AI信息差 2025-05-16

最艺术的Flux

今天推荐一个非常有艺术感的Flux模型：Fluxmania 华丽幻想风格人物肖像（这幅图像描绘了一位身着精致华丽、充满幻想风格服饰的人物肖像。人物头戴装饰繁复的头饰，包含羽毛、宝石和金属装饰等精美设计。头饰中央镶嵌着一枚圆形宝石或类似装...

安爸

18 0

AI信息差 2025-05-16

阶跃星辰×光影焕像联合打造超强3D生成引擎Step1X-3D！还开源全链路训练代码

阶跃星辰携手光影焕像发布并开源 3D 大模型 ——Step1X-3D。Step1X-3D 模型总参数量达 4.8B（几何模块 1.3B，纹理模块 3.5B），凭借坚实的数据基础与先进的 3D 原生架构，可生成高保真、可控的 3D 内容。 ...

安爸

18 0

AI信息差 2025-05-16

DeepSeek发布最新论文，5大杀手锏让大模型训练、推理暴涨

昨天，全球著名开源大模型平台DeepSeek在huggingface发布了，超强开源模型V3的论文。主要从硬件架构和模型设计的双视角探讨如何在不牺牲性能的前提下实现更高效的大规模训练和推理以突破硬件瓶颈。其中，DeepSeek-MoE和...

安爸

17 0

AI信息差 2025-05-16

特朗普要求苹果，停止在印度生产iPhone

昨天，CNBC消息，特朗普已告诉苹果CEO库克，不希望这家科技巨头在印度生产产品。特朗普说：“我昨天和库克有点小矛盾，我不想让他在印度生产。” 苹果一直在加大在印度的生产力度，计划未来几年在该国生产全球约25%的iPhone，以减少对中国...

安爸

19 0

AI信息差 2025-05-16

DiffMoE：动态Token选择助力扩散模型性能飞跃，快手&清华团队打造视觉生成新标杆！

本文由清华大学和快手可灵团队共同完成。第一作者是清华大学智能视觉实验室在读本科生史明磊。在生成式 AI 领域，扩散模型（Diffusion Models）已成为图像生成任务的主流架构。然而，传统扩散模型在处理不同噪声水平和条件输入时采用...

安爸

20 0

AI信息差 2025-05-16

超越OpenAI、拿下全球双料第一，“AI吴彦祖”背后大模型SOTA了！

明敏发自凹非寺量子位 | 公众号 QbitAI 超越OpenAI！国产大模型突袭，AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02，同时拿下Artificial Analysis Speech Arena和...

安爸

19 0

AI信息差 2025-05-16

ChatGPT的记忆机制被公开了

鹭羽发自凹非寺量子位 | 公众号 QbitAI ChatGPT新版记忆功能居然被民间大佬逆向工程了！能引用历史记录，甚至还能悄悄藏个人资料？最近OpenAI推出了一项名为聊天历史记录的额外记忆功能，允许ChatGPT引用历史对话...

安爸

17 0

AI信息差 2025-05-16

GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

General-Level团队投稿量子位 | 公众号 QbitAI 多模态大模型（Multimodal Large Language Models, MLLM）正迅速崛起，从只能理解单一模态，到如今可以同时理解和生成图像、文本、音频甚至...

安爸

17 0

AI信息差 2025-05-16

创新性自动化 AI 工具-终结者机器人

Terminator 🤖 终结者机器人 Terminator 是最快的AI优先计算机操作SDK。它采用类似Playwright的API与Windows原生GUI应用交互，如同解析网页一般。通过操作系统级无障碍API，相比基于视觉的方案，Te...

安爸

17 0

AI信息差 2025-05-16

超低延迟的端到端语音模型！首次生成音频仅需53ms，比同级别模型快3-5倍！

随着语音助手、有声交互、AI 角色配音等场景的普及，语音大模型也正在面临一个核心瓶颈：响应速度太慢，难以实时交互。今天为大家介绍一款由 VITA 团队开源的端到端语音模型：VITA-Audio，可以带来前所未有的超低延迟体验，让语音生成进...

安爸

17 0

安爸 的文章

安爸的文章