AI 工具

ChatGPT

通用型 AI 助手，适合起草内容、整理想法、解释资料、辅助写代码、处理图片任务，也能把零散念头变成更清楚的输出。

适合场景

日常写作、想法发展、快速解释资料，以及搭建个人或小生意可重复使用的工作流。

写作研究编程图像

Claude

适合长文档阅读、结构化写作、分析、代码讨论和细致改稿的 AI 助手，回答风格通常比较稳、比较有层次。

适合场景

深度阅读、文章重写、内容规划、客户笔记，以及需要语气和判断力的复杂对话。

写作分析文档编程

Claude Code

Anthropic 推出的终端 AI 编码代理工具，直接运行在命令行，能读取代码库、执行测试、自动重构并管理 Git 提交。

适合场景

偏好命令行操作、需要自动化处理代码重构、测试执行和 Git 提交流程的开发者。

编程开发者工作流

anthropicclaude推理security

Claude Fable 5

Anthropic 推出的新一代大语言模型，继承了高度敏感的安全强化模型 Claude Mythos 5 的推理底层，并配备了企业级的全方位安全与合规防护机制。

适合场景

需要处理高难度网络安全合规性审查、复杂多步骤业务规划以及需要极佳安全对齐表现的企业级应用。

Cursor

专为 AI 辅助编程设计的代码编辑器，基于 VS Code 开发，具有强大的全库上下文理解、智能自动补全和多文件 Composer 功能。

适合场景

寻求无缝 AI 自动补全、全项目上下文对话以及多文件协同编辑的日常开发人员。

编程开发者工作区

ElevenLabs

行业领先的 AI 语音与音频生成平台，提供极为逼真的文本转语音、声音克隆、音效生成及高保真 AI 背景音乐创作能力。

适合场景

需要超自然旁白配音、多语言翻译、游戏音效、声音克隆，以及一站式音频工作流的视频创作者、独立开发者与企业。

配音与语音文本转语音音频创意

图像生成开源开源精选

FLUX.2

Black Forest Labs 的图像生成模型，适合测试高质量视觉生成、创意概念图和可控图片工作流。

适合场景

图片生成、视觉方向探索、设计原型，以及把开源图像模型接入自定义创作流程。

Hugging Face图片生成设计开源模型

Free Claude Code

一个开源的 Claude Code 代理工具，允许你在终端、VSCode 插件或 Discord 中免费或使用自定义模型运行 Claude Code CLI。

适合场景

希望在本地终端或 VSCode 中免费使用 Claude Code 官方命令行工具，或将其路由到 Gemini、DeepSeek 等其他大模型的开发者。

claude code开发者proxy开源

Gemini

Google 推出的多模态 AI 助手，依托 Gemini 3.1 Pro 模型，拥有业界领先的 200 万 Token 超长上下文窗口，支持复杂的文档分析与音视频理解。

适合场景

需要一次性分析超长文档（如整本书、数百页 PDF）、处理超长视频或音频，以及深度整合 Google 生态的专业用户。

写作研究谷歌分析

GPT-5.6

OpenAI 推出的下一代前沿大语言模型系列，包含 Sol、Terra 和 Luna 三个版本，专注于高级数理推理、复杂系统编程和强化安全防护。

适合场景

需要处理高难度网络安全防护、深层学术研究、大型代码库重构，以及追求前沿大模型极限推理能力的专业用户。

openai推理agent编程

Ollama

开源本地模型工具，让开发者和重视隐私的用户可以在自己的电脑上运行、测试大语言模型。

适合场景

在本机测试模型、搭建本地 AI 原型，并减少对云端 AI 服务的依赖。

本地模型开发者隐私大语言模型

文本生成开源开源精选

Qwen3.6

阿里 Qwen 系列开放模型，适合开发者测试中文、代码、推理和多模态应用场景。

适合场景

中文与英文混合工作流、代码实验、本地模型比较，以及自托管 AI 产品原型。

Hugging Face大语言模型编程多模态

Seed 2.1 Pro

字节跳动推出的一款高性能智能体（Agent）大语言模型，具备极强的复杂任务规划、深度思考逻辑与代码自愈（Self-repair）能力，提供极致的性价比。

适合场景

需要低成本构建复杂 AI Agent、自动化工程重构、多步骤数据分析及需要极高性价比的企业与开发者。

agent编程推理bytedance

视频制作免费试用/增值服务精选

Seedance 2.5

字节跳动（ByteDance）推出的新一代 AI 视频生成模型，支持单次生成 30 秒 4K 原生画质视频，并能通过多达 50 种多模态输入维持极高的角色与风格一致性。

适合场景

需要生成长镜头、维持角色和视觉风格高度一致的视频创作者、广告设计师及动画制作人员。

视频bytedance创意多模态

Suno

全球领先的 AI 音乐与歌曲生成器，支持通过简单的中文或英文文本提示词，在几秒钟内生成包含高质量人声歌唱与歌词的完整原创歌曲。

适合场景

需要快速创作原创歌曲、短视频背景音轨、个性化音乐礼物、或进行歌词概念创作的创作者与音乐爱好者。

音乐生成音频配音与语音创意

opensourceavatar多模态interactive

Udio

专业的 AI 音乐生成与创作平台，以超高质量的乐器音效、真实感极强的人声表现以及强大的局部细节微调能力而闻名。

适合场景

追求极致音质、需要精细化控制歌曲分段（如局部重构、延长、伴奏单独编辑）的半专业音乐人与创作者。

音乐生成音频剪辑创意

视频制作免费开源精选

Wan-Streamer v0.1

阿里巴巴联合 Wan 团队开源的端到端多模态音频视频实时流式大模型，在统一的 Transformer 架构中同步训练音画与文本，实现了低于 200ms 的超低延迟互动。

适合场景

需要构建实时虚拟客服、AI 伴侣、极低延迟互动分身以及端侧多模态互动的开发者与科研机构。

ACE-Step 1.5

开源、本地可部署的 AI 音乐生成模型，支持利用文本生成完整乐曲和歌词，且支持 LoRA 个性化声音与风格微调。

适合场景

想在本地部署音乐生成模型、训练自己的专属歌声/曲风 LoRA，或探索开源 AI 音乐生成技术流程的开发者与进阶创作者。

音乐生成音频开源本地模型

3D assetsgame development创意工作流

AssetHub

面向 3D 创作者和游戏原型制作的 AI 资产平台，适合快速生成、整理和测试可进入 Blender、Unreal Engine 等流程的 3D 资产。

适合场景

想快速获得角色、道具、场景元素等 3D 资产起点，并把它们继续带进 Blender 或 Unreal Engine 工作流的创作者。

商业运用免费试用/增值服务

Canva AI

Canva 的 AI 设计功能能在熟悉的视觉编辑器里生成简报、社交图片、文案、图片、视频和品牌素材。

适合场景

非设计师快速制作内容素材、工作坊简报、下载资源、小生意宣传图和社交媒体设计。

设计演示文稿社交媒体图像

视频制作免费试用/增值服务

CapCut

创作者友好的视频编辑器，提供模板、字幕、快速剪辑、特效和 AI 辅助编辑，适合社交媒体内容。

适合场景

剪 Reels、TikTok、YouTube Shorts、口播视频，以及不想上复杂剪辑软件的日常内容。

视频剪辑字幕社交媒体

ComfyUI

节点式开源图片生成界面，适合想深度控制模型、提示词、参数和生成流程的人。

适合场景

高级图片生成流程，尤其是重视控制力、可重复性和实验空间，而不只是追求简单操作。

开源图像工作流Stable Diffusion

DeepSeek

DeepSeek 系列模型入口，适合关注推理、代码、长文本处理和开源模型生态的人追踪与测试。

适合场景

研究推理模型、代码助手能力，以及把 DeepSeek 模型接入本地或自托管工作流。

Hugging Face推理编程大语言模型

Gemma 4

Google DeepMind 的开放模型系列入口，适合测试多模态理解、指令跟随和本地 AI 应用原型。

适合场景

想评估 Google 开放模型、构建本地助手，或比较多模态模型能力的开发者。

Hugging Face多模态大语言模型谷歌

LTX 2.3

Lightricks 的开源 AI 视频生成模型，支持 text-to-video、image-to-video、audio-to-video、竖屏视频和同步音频生成，适合实验本地或 API 视频工作流。

适合场景

想用开源模型测试 AI 短视频、口播、audio-to-video、image-to-video 或 ComfyUI 视频工作流的创作者和开发者。

视频生成开源音频本地模型

图像生成付费

Midjourney

视觉生成工具，适合做概念图、情绪板、缩略图、品牌方向探索，以及有风格感的图片变体。

适合场景

在确定最终视觉风格之前，快速探索多个有质感的图片方向。

图像设计品牌创意

图像生成免费试用/增值服务

Nano Banana Pro

Google 的 Gemini 3 Pro Image 图像生成与编辑模型，擅长更准确的视觉推理、文字渲染、信息图、产品图和多参考图创作。

适合场景

想测试 Gemini 图像生成、产品宣传图、信息图、带文字图片和多参考图编辑效果的创作者。

图片生成谷歌设计多模态

生产力工具付费

Notion AI

内置在 Notion 里的 AI，可用于总结笔记、优化草稿、根据工作区内容回答问题，并整理凌乱的知识库。

适合场景

已经用 Notion 管理笔记、项目或团队文档，并希望 AI 直接嵌入工作区的人。

笔记知识管理写作工作区

OmniVoice

开源多语言语音克隆与文本转语音模型，支持少量语音样本进行 zero-shot voice cloning，适合 AI 旁白、口播和多语言配音实验。

适合场景

想用自己的声音做 AI 旁白、口播、短视频配音，或研究开源多语言 TTS 与声音克隆的创作者和开发者。

配音与语音文本转语音开源音频

其他开源开源

Open WebUI

自托管 AI 聊天界面，可把本地或云端模型变成熟悉的聊天体验，并提供模型管理和团队使用功能。

适合场景

把 Ollama 或其他模型后端变成可用的私人或团队 AI 聊天工作区。

开源自托管本地模型对话聊天

编程与开发开源开源

Remotion

用 React 和 TypeScript 以编程方式制作视频的开源框架，适合把图片、音频、字幕、动画和数据组织成可重复的视频工作流。

适合场景

想用代码控制视频时间轴、批量生成内容、制作歌词视频、产品演示、课程片段或数据驱动视频的创作者和开发者。

视频编程开源工作流

Sulphur 2

基于 LTX Video (LTX 2.3) 的开源本地视频生成模型，支持高效的文本生成视频与图片生成视频。

适合场景

想在本地部署高性能视频模型、探索 AI 视频工作流与微调的创作者和开发者。

Hugging Face视频生成本地模型开源

编程与开发免费

Unreal Engine MCP

Unreal Engine 5.8 引入的 MCP 工作流方向，让 Claude Code 等 AI agent 能通过受控接口参与游戏项目、场景和玩法逻辑开发。

适合场景

希望把 AI coding agent 接入 Unreal Engine 项目，用来协助玩法逻辑、项目结构和重复编辑任务的技术美术、开发者和 solo game creator。

编程game developmentMCP工作流

Z-Image

通义 MAI 的图像生成模型，适合测试快速出图、中文语境视觉生成和开源图片模型工作流。

适合场景

快速生成视觉草稿、比较中文提示词效果，并探索图片生成模型在内容制作里的用法。

Hugging Face图片生成开源模型创意

3Dworld modelgame development多模态

腾讯混元世界 2.0（HY-World）

腾讯混元推出的 3D 世界模型。输入文字、单张图片或视频，就能生成一个高保真、可漫游的 3D 世界（3DGS / Mesh），并可导出到 Unity 与 Unreal Engine。

适合场景

需要快速生成 3D 世界原型、数字孪生或训练环境的游戏开发者、影视制作人、设计师与机器人团队。

ChatGPT

通用型 AI 助手，适合起草内容、整理想法、解释资料、辅助写代码、处理图片任务，也能把零散念头变成更清楚的输出。

适合场景

日常写作、想法发展、快速解释资料，以及搭建个人或小生意可重复使用的工作流。

写作研究编程图像

Claude

适合长文档阅读、结构化写作、分析、代码讨论和细致改稿的 AI 助手，回答风格通常比较稳、比较有层次。

适合场景

深度阅读、文章重写、内容规划、客户笔记，以及需要语气和判断力的复杂对话。

写作分析文档编程

Claude Code

Anthropic 推出的终端 AI 编码代理工具，直接运行在命令行，能读取代码库、执行测试、自动重构并管理 Git 提交。

适合场景

偏好命令行操作、需要自动化处理代码重构、测试执行和 Git 提交流程的开发者。

编程开发者工作流

anthropicclaude推理security

Claude Fable 5

Anthropic 推出的新一代大语言模型，继承了高度敏感的安全强化模型 Claude Mythos 5 的推理底层，并配备了企业级的全方位安全与合规防护机制。

适合场景

需要处理高难度网络安全合规性审查、复杂多步骤业务规划以及需要极佳安全对齐表现的企业级应用。

Cursor

专为 AI 辅助编程设计的代码编辑器，基于 VS Code 开发，具有强大的全库上下文理解、智能自动补全和多文件 Composer 功能。

适合场景

寻求无缝 AI 自动补全、全项目上下文对话以及多文件协同编辑的日常开发人员。

编程开发者工作区

ElevenLabs

行业领先的 AI 语音与音频生成平台，提供极为逼真的文本转语音、声音克隆、音效生成及高保真 AI 背景音乐创作能力。

适合场景

需要超自然旁白配音、多语言翻译、游戏音效、声音克隆，以及一站式音频工作流的视频创作者、独立开发者与企业。

配音与语音文本转语音音频创意

图像生成开源开源精选

FLUX.2

Black Forest Labs 的图像生成模型，适合测试高质量视觉生成、创意概念图和可控图片工作流。

适合场景

图片生成、视觉方向探索、设计原型，以及把开源图像模型接入自定义创作流程。

Hugging Face图片生成设计开源模型

Free Claude Code

一个开源的 Claude Code 代理工具，允许你在终端、VSCode 插件或 Discord 中免费或使用自定义模型运行 Claude Code CLI。

适合场景

希望在本地终端或 VSCode 中免费使用 Claude Code 官方命令行工具，或将其路由到 Gemini、DeepSeek 等其他大模型的开发者。

claude code开发者proxy开源

Gemini

Google 推出的多模态 AI 助手，依托 Gemini 3.1 Pro 模型，拥有业界领先的 200 万 Token 超长上下文窗口，支持复杂的文档分析与音视频理解。

适合场景

需要一次性分析超长文档（如整本书、数百页 PDF）、处理超长视频或音频，以及深度整合 Google 生态的专业用户。

写作研究谷歌分析

GPT-5.6

OpenAI 推出的下一代前沿大语言模型系列，包含 Sol、Terra 和 Luna 三个版本，专注于高级数理推理、复杂系统编程和强化安全防护。

适合场景

需要处理高难度网络安全防护、深层学术研究、大型代码库重构，以及追求前沿大模型极限推理能力的专业用户。

openai推理agent编程

Ollama

开源本地模型工具，让开发者和重视隐私的用户可以在自己的电脑上运行、测试大语言模型。

适合场景

在本机测试模型、搭建本地 AI 原型，并减少对云端 AI 服务的依赖。

本地模型开发者隐私大语言模型

文本生成开源开源精选

Qwen3.6

阿里 Qwen 系列开放模型，适合开发者测试中文、代码、推理和多模态应用场景。

适合场景

中文与英文混合工作流、代码实验、本地模型比较，以及自托管 AI 产品原型。

Hugging Face大语言模型编程多模态

Seed 2.1 Pro

字节跳动推出的一款高性能智能体（Agent）大语言模型，具备极强的复杂任务规划、深度思考逻辑与代码自愈（Self-repair）能力，提供极致的性价比。

适合场景

需要低成本构建复杂 AI Agent、自动化工程重构、多步骤数据分析及需要极高性价比的企业与开发者。

agent编程推理bytedance

视频制作免费试用/增值服务精选

Seedance 2.5

适合场景

需要生成长镜头、维持角色和视觉风格高度一致的视频创作者、广告设计师及动画制作人员。

视频bytedance创意多模态

Suno

全球领先的 AI 音乐与歌曲生成器，支持通过简单的中文或英文文本提示词，在几秒钟内生成包含高质量人声歌唱与歌词的完整原创歌曲。

适合场景

需要快速创作原创歌曲、短视频背景音轨、个性化音乐礼物、或进行歌词概念创作的创作者与音乐爱好者。

音乐生成音频配音与语音创意

opensourceavatar多模态interactive

Udio

专业的 AI 音乐生成与创作平台，以超高质量的乐器音效、真实感极强的人声表现以及强大的局部细节微调能力而闻名。

适合场景

追求极致音质、需要精细化控制歌曲分段（如局部重构、延长、伴奏单独编辑）的半专业音乐人与创作者。

音乐生成音频剪辑创意

视频制作免费开源精选

Wan-Streamer v0.1

适合场景

需要构建实时虚拟客服、AI 伴侣、极低延迟互动分身以及端侧多模态互动的开发者与科研机构。

ACE-Step 1.5

开源、本地可部署的 AI 音乐生成模型，支持利用文本生成完整乐曲和歌词，且支持 LoRA 个性化声音与风格微调。

适合场景

想在本地部署音乐生成模型、训练自己的专属歌声/曲风 LoRA，或探索开源 AI 音乐生成技术流程的开发者与进阶创作者。

音乐生成音频开源本地模型

3D assetsgame development创意工作流

AssetHub

面向 3D 创作者和游戏原型制作的 AI 资产平台，适合快速生成、整理和测试可进入 Blender、Unreal Engine 等流程的 3D 资产。

适合场景

想快速获得角色、道具、场景元素等 3D 资产起点，并把它们继续带进 Blender 或 Unreal Engine 工作流的创作者。

商业运用免费试用/增值服务

Canva AI

Canva 的 AI 设计功能能在熟悉的视觉编辑器里生成简报、社交图片、文案、图片、视频和品牌素材。

适合场景

非设计师快速制作内容素材、工作坊简报、下载资源、小生意宣传图和社交媒体设计。

设计演示文稿社交媒体图像

视频制作免费试用/增值服务

CapCut

创作者友好的视频编辑器，提供模板、字幕、快速剪辑、特效和 AI 辅助编辑，适合社交媒体内容。

适合场景

剪 Reels、TikTok、YouTube Shorts、口播视频，以及不想上复杂剪辑软件的日常内容。

视频剪辑字幕社交媒体

ComfyUI

节点式开源图片生成界面，适合想深度控制模型、提示词、参数和生成流程的人。

适合场景

高级图片生成流程，尤其是重视控制力、可重复性和实验空间，而不只是追求简单操作。

开源图像工作流Stable Diffusion

DeepSeek

DeepSeek 系列模型入口，适合关注推理、代码、长文本处理和开源模型生态的人追踪与测试。

适合场景

研究推理模型、代码助手能力，以及把 DeepSeek 模型接入本地或自托管工作流。

Hugging Face推理编程大语言模型

Gemma 4

Google DeepMind 的开放模型系列入口，适合测试多模态理解、指令跟随和本地 AI 应用原型。

适合场景

想评估 Google 开放模型、构建本地助手，或比较多模态模型能力的开发者。

Hugging Face多模态大语言模型谷歌

LTX 2.3

Lightricks 的开源 AI 视频生成模型，支持 text-to-video、image-to-video、audio-to-video、竖屏视频和同步音频生成，适合实验本地或 API 视频工作流。

适合场景

想用开源模型测试 AI 短视频、口播、audio-to-video、image-to-video 或 ComfyUI 视频工作流的创作者和开发者。

视频生成开源音频本地模型

图像生成付费

Midjourney

视觉生成工具，适合做概念图、情绪板、缩略图、品牌方向探索，以及有风格感的图片变体。

适合场景

在确定最终视觉风格之前，快速探索多个有质感的图片方向。

图像设计品牌创意

图像生成免费试用/增值服务

Nano Banana Pro

Google 的 Gemini 3 Pro Image 图像生成与编辑模型，擅长更准确的视觉推理、文字渲染、信息图、产品图和多参考图创作。

适合场景

想测试 Gemini 图像生成、产品宣传图、信息图、带文字图片和多参考图编辑效果的创作者。

图片生成谷歌设计多模态

生产力工具付费

Notion AI

内置在 Notion 里的 AI，可用于总结笔记、优化草稿、根据工作区内容回答问题，并整理凌乱的知识库。

适合场景

已经用 Notion 管理笔记、项目或团队文档，并希望 AI 直接嵌入工作区的人。

笔记知识管理写作工作区

OmniVoice

开源多语言语音克隆与文本转语音模型，支持少量语音样本进行 zero-shot voice cloning，适合 AI 旁白、口播和多语言配音实验。

适合场景

想用自己的声音做 AI 旁白、口播、短视频配音，或研究开源多语言 TTS 与声音克隆的创作者和开发者。

配音与语音文本转语音开源音频

其他开源开源

Open WebUI

自托管 AI 聊天界面，可把本地或云端模型变成熟悉的聊天体验，并提供模型管理和团队使用功能。

适合场景

把 Ollama 或其他模型后端变成可用的私人或团队 AI 聊天工作区。

开源自托管本地模型对话聊天

编程与开发开源开源

Remotion

用 React 和 TypeScript 以编程方式制作视频的开源框架，适合把图片、音频、字幕、动画和数据组织成可重复的视频工作流。

适合场景

想用代码控制视频时间轴、批量生成内容、制作歌词视频、产品演示、课程片段或数据驱动视频的创作者和开发者。

视频编程开源工作流

Sulphur 2

基于 LTX Video (LTX 2.3) 的开源本地视频生成模型，支持高效的文本生成视频与图片生成视频。

适合场景

想在本地部署高性能视频模型、探索 AI 视频工作流与微调的创作者和开发者。

Hugging Face视频生成本地模型开源

编程与开发免费

Unreal Engine MCP

Unreal Engine 5.8 引入的 MCP 工作流方向，让 Claude Code 等 AI agent 能通过受控接口参与游戏项目、场景和玩法逻辑开发。

适合场景

希望把 AI coding agent 接入 Unreal Engine 项目，用来协助玩法逻辑、项目结构和重复编辑任务的技术美术、开发者和 solo game creator。

编程game developmentMCP工作流

Z-Image

通义 MAI 的图像生成模型，适合测试快速出图、中文语境视觉生成和开源图片模型工作流。

适合场景

快速生成视觉草稿、比较中文提示词效果，并探索图片生成模型在内容制作里的用法。

Hugging Face图片生成开源模型创意