取消

AI系列66:LTX-Video

LTX-Video 是由以色列科技公司 Lightricks 开发的开源视频生成模型，是全球首个基于 DiT（Diffusion 扩散Transformer）架构的实时高质量视频生成模型。它通过创新的时空压缩技术和硬件优化，实现了 “生成速度快于视频播放速度” 的革命性突破。： 🧠 一、核心定位与技术突破实时高清视频生成支持 1216×704@30FP...

06-212025-06-21T05:30:00+08:00 7 分钟

AI系列65:Phi3与Phi Silica

Phi Silica 和 Phi-3 是微软推出的轻量级语言模型（SLM）系列中的不同成员，二者定位、架构和应用场景有显著差异。： 🧠 一、核心定位与设计目标 | 特性 | Phi-3 系列 | Phi Silica | |——————–|————————————|————————————...

06-202025-06-20T05:30:00+08:00 4 分钟

AI系列64:claude哪个模型最强

Claude Opus 4 是Anthropic目前最强大的模型，被官方称为“全球最佳编程模型”和“公司迄今最智能的AI系统”： ⚡️ 一、Claude Opus 4的核心优势编程能力全球领先在权威软件工程基准测试 SWE-bench 中达到 72.5% 的准确率，超越前代Opus及多数竞品（如GPT-4o）。实际开发中表现突出： ...

06-192025-06-19T05:30:00+08:00 5 分钟

AI系列63:AIPC NPU端侧大模型

AI PC 的 NPU（神经处理单元）上运行端侧大模型，能通过软硬件协同优化，实现高效能、低延迟的端侧 AI 体验： 🧠 一、轻量文本模型（专注语言任务） 1. Phi-3 Silica（微软）参数：3B 核心特性：专为 Copilot+ PC 设计，适配 NPU 算力，支持 128K 长上下文，推理延迟 <100ms。在端侧实...

06-182025-06-18T05:30:00+08:00 6 分钟

AI系列62:Gemma 3n

Gemma 3 和 Gemma 3n 是 Google DeepMind 在 2025 年推出的两代开源大模型，定位互补但技术架构与应用场景差异显著： 🧠 一、Gemma 3：高性能通用多模态模型 1. 核心定位与特性开源多模态基座：支持文本、图像、短视频输入，具备跨模态推理能力（如图像问答、视频摘要）。参数规模：提供 1B/4B/12B/27B 四档参数版本，均支持 1...

06-172025-06-17T05:30:00+08:00 5 分钟

AI系列61:minicpm

效果很惊艳：https://m.youtube.com/watch?v=JFJg9KZ_iZk MiniCPM 系列是由中国人工智能公司面壁智能（OpenBMB）研发的高效端侧大模型家族，专注于在低资源设备（如手机、平板）实现高性能多模态能力。以下是三款模型的详细解析与技术对比： 🧠 一、模型概览与核心定位 | 模型 | 发布时间 | 核心定位 ...

06-162025-06-16T05:30:00+08:00 7 分钟

AI系列60:Perplexity

Perplexity AI 是一家专注于对话式搜索引擎（Answer Engine）的创新型人工智能公司，成立于 2022 年，总部位于美国旧金山。它通过融合实时网络检索与大语言模型（LLM）能力，直接为用户提供精准、可验证的答案，而非传统搜索引擎的链接列表。其核心定位是“让知识获取像对话一样自然”，目前月查询量超 7.8 亿次，被英伟达创始人黄仁勋称为“几乎每天使用”的工具。 🔍...

06-152025-06-15T05:30:00+08:00 6 分钟

AI系列59:ElevenLabs

前面刚写了12 labs，这里又来了一个11 labs， ElevenLabs 是一家专注于生成式AI语音技术的创新公司，成立于2022年。其核心目标是通过AI模型消除语言障碍，提供高度逼真的语音合成、克隆及多语言配音服务，已成为估值超11亿美元的独角兽企业： AI语音技术先驱，致力于创造最自然，最富表现力的AI语音解决方案。 🧠 一、核心技术与功能自然语音合成（TTS） ...

06-142025-06-14T05:30:00+08:00 5 分钟

AI系列58:TwelveLabs视频理解

TwelveLabs（Twelve Labs Inc.）是一家专注于多模态视频理解技术的创新型人工智能公司，总部位于美国旧金山，创立于2021年。其核心目标是通过自研的AI模型，使机器能够像人类一样深度理解视频内容，实现“让视频的处理和搜索变得和文本一样容易”： 🧠 一、核心定位与技术优势视频优先（Video-First）策略 TwelveLabs 并非将视频视为图像或音频的简...

06-132025-06-13T05:30:00+08:00 4 分钟

AI系列57:Cherry Studio

Cherry Studio 是一款功能强大的开源跨平台多模型AI桌面客户端，支持 Windows、macOS 和 Linux 系统。它集成了多种主流大语言模型（如 OpenAI、Gemini、Anthropic、DeepSeek 等）以及本地模型（通过 Ollama），允许用户自由切换云端或本地模型，同时支持多模型对话对比、文件管理、知识库构建、AI绘画、翻译等功能。其核心亮点包括：内置 3...

06-122025-06-12T05:30:00+08:00 4 分钟

1
...
3
4
5
...
41
4 / 41

热门标签