安爸-超级家庭
bg
avatar

安爸

卸掉美颜,追求真实,红潮Flux更新

Flux的原生模型普遍有一种油腻感,为了去除这种油腻感,国内很多创作者训练了适合中国女孩的Flux模型。 但大部分都是美颜过重,缺乏一种真实感。 红潮在这方面做的比较好,一方面保留了东方女性的独特美丽,另一方面没有特别浓重的美颜效果。 深夜驾驶中的通话者 (图片中,一名身穿黄色夹克的人坐在看似是车辆的座位上。此人一手握着方向盘,另一手将电话贴在耳边。光线昏...

阅读:10 评论:0

Llama 4开源空降!1000万超长上下文、单GPU可跑,还有近2万亿参数巨模型

三大模型登场:“巨杯”总参数近2万亿,“小杯”10M超长上下文,“中杯”推理编程媲美DeepSeek。 编译 | ZeR0 编辑 | 漠影 智东西4月6日报道,今日,Meta发布Llama 4系列首批模型,包括两款高效模型Llama 4 Scout、Llama 4 Maverick。这是Meta首款采用混合专家(MoE)架构构建的原生多模态模型,...

阅读:12 评论:0

从0到1玩转MCP:AI的「万能插头」,代码手把手教你!

选自Towards Data Science 作者:Sandi Besen 机器之心编译 在人工智能飞速发展的今天,LLM 的能力令人叹为观止,但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」,无法直接触及实时信息或外部工具。 2024 年 11 月,Anthropic 推出了开源协议 MCP(Model Context Protocol,模型上...

阅读:11 评论:0

LLM「想太多」有救了!高效推理让大模型思考过程更精简

新智元报道 编辑:英智 【新智元导读】大模型虽然推理能力增强,却常常「想太多」,回答简单问题也冗长复杂。Rice大学的华人研究者提出高效推理概念,探究了如何帮助LLM告别「过度思考」,提升推理效率。 LLM的推理能力显著增强,然而,这个「超级大脑」也有自己的烦恼。 有时候回答会绕好大一个圈子,推理过程冗长又复杂,虽能得出正确答案,但耗费了不少时间和...

阅读:10 评论:0

情感语音的“开源先锋”!网易开源的一款TTS神器,2000种声音随意切换!

语音合成技术现已广泛应用于语音克隆、语音助手、配音服务、有声读物等领域,但如何让合成语音更具情感、更贴近人类表达,一直是语音行业研究的主要方向。 今天,推荐一款网易有道推出的 TTS 开源模型:EmotiVoice。 这是一个强大的开源 TTS 引擎,完全免费,支持中英文双语,还包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲...

阅读:12 评论:0

Oliva Multi-Agent Assistant:一个强大的多Agent助手

Oliva Multi-Agent Assistant:一个强大的多Agent助手,帮助用户通过语音和文本在Qdrant数据库中快速找到所需产品。亮点: 集成Langchain和Superlinked,实现高效语义搜索; 支持语音交互,通过Livekit和Deepgram实现语音输入和输出; 模块化架构,轻松扩展和定制Agent功能。 参考文献: ...

阅读:11 评论:0

Basic Memory:通过与AI助手的对话构建持久语义图谱

Basic Memory:通过与AI助手的对话构建持久语义图谱,将知识存储在本地Markdown文件中,让你完全掌控数据所有权。亮点:1. 本地存储,数据安全可控;2. 无缝集成Obsidian,提升知识管理效率;3. 支持实时同步,知识更新零延迟。 参考文献: [1] https://github.com/basicmachines-co/basic...

阅读:9 评论:0

npcsh:AI开发者的强大工具箱,让AI Agent轻松集成到日常工作流程中

npcsh:AI开发者的强大工具箱,让AI Agent轻松集成到日常工作流程中。亮点:1. 通过命令行和Python库实现智能交互;2. 提供多种实用宏命令,如语音控制、图像生成、数据检索;3. 支持多种AI模型和提供商,灵活适配不同需求。 参考文献: [1] https://github.com/cagostino/npcsh (文:NLP工程化...

阅读:10 评论:0

炸裂!Meta深夜推出Llama 4系列 :单卡H100能跑,千万上下文,还有2万亿“巨兽”

小扎终于想起发布 Llama 4 了,本来早就应该发布的的节奏全被DeepSeek R1打乱了,哈哈! Meta 刚刚放出了 Llama 4 系列的首批模型,按照官推的说法这次发布是对 Llama 系列的一次彻底重新设计 先划重点: 核心变化:Llama 4 全系采用混合专家(MoE)架构,并且是原生多模态训练,不再是 Llama 3 那样的纯文本模型了...

阅读:10 评论:0

全网都在猜,这些视频是不是字节AI生成的:该跟动捕说再见了?

机器之心报道 编辑:梓文 动作捕捉,刚刚发生了革命。 在 GPT-4o 的风到处吹时,X 平台(原推特)上有好多带视频的帖子爆了。到底是什么引来了一百万的浏览量? 没错,是玛丽莲・梦露「活了过来」。她不仅能够语音 — 口型保持一致,动作也能复刻参考示例。在大幅度的手臂摆动时,也不会出现严重的变形或虚影。 网友瞳孔震惊,「别告诉我,这些都是 AI 生成的…...

阅读:10 评论:0