2503 字
13 分钟
AIRI 使用教程:搭建你的专属 AI 虚拟伴侣

AIRI 是什么#

AIRI(アイリ)是一个开源的 AI 虚拟伴侣框架,受知名 AI VTuber Neuro-sama 启发,旨在让你轻松拥有自己的赛博生命。它由 TypeScript + Vue.js 构建,支持 Web、桌面和移动端运行。

核心特性:

特性说明
开源协议MIT,可自由使用和修改
GitHub Stars39,000+
最新版本v0.10.2(2026-05-07)
运行平台Web 浏览器 / Windows 桌面 / macOS / Linux / 移动端
LLM 提供商支持 40+ 家(OpenAI、Claude、DeepSeek、通义千问、Ollama 等)
角色渲染Live2D + VRM 3D,自动眨眼、视线追踪、空闲动画
语音交互浏览器/ Discord 语音输入,客户端语音识别,TTS 语音合成
游戏联动Minecraft(mineflayer)、Factorio(RCON)
社交集成Discord 机器人、Telegram 机器人
插件系统插件 SDK、MCP 协议支持、工具调用 API

项目起源#

AIRI 要解决的核心问题是:Neuro-sama 不开源,下播后无法互动。AIRI 让你可以自托管一个同样能力的 AI 虚拟角色,随时随地陪伴你聊天、玩游戏。

项目官网:airi.moeru.ai | GitHub:moeru-ai/airi

系统要求#

桌面版(Tamagotchi)#

平台要求
WindowsWindows 10+,64-bit
macOSmacOS 12+,Apple Silicon(M1/M2/M3/M4)
Linux支持 AppImage 的发行版
内存建议 8 GB+(取决于 LLM 提供商和语音模型)
存储约 500 MB(不含模型和语音文件)

网页版(Stage Web)#

项目要求
浏览器Chrome 113+、Edge 113+、Firefox 121+、Safari 18.2+
WebGPU需要浏览器支持 WebGPU 以获得最佳性能
网络需连接 LLM API 和 TTS 服务

源码编译#

项目要求
Node.js23+(推荐最新 LTS)
包管理器pnpm(v9+)
Rust可选,编译原生模块时需要
WindowsVisual Studio Build Tools 2022(C++ workload)

安装#

AIRI 提供多种安装方式,推荐新手直接下载预编译二进制文件。

方法一:桌面版安装包(推荐新手)#

前往 GitHub Releases 页面 下载对应平台的安装包:

平台下载文件
WindowsAIRI-<version>-windows-x64-setup.exe
macOSAIRI-<version>-darwin-arm64.dmg
LinuxAIRI-<version>-linux-x86_64.AppImage

下载后双击安装,按引导完成即可。启动后会自动进入引导配置。

Windows 用户还可通过 Scoop 安装:

Terminal window
scoop bucket add airi https://github.com/moeru-ai/airi
scoop install airi/airi

方法二:网页版(无需安装)#

直接打开 airi.moeru.ai 即可在浏览器中使用。网页版支持 PWA,可添加到主屏幕获得接近原生应用的体验。

方法三:源码编译(面向开发者)#

Terminal window
# 克隆仓库
git clone https://github.com/moeru-ai/airi.git
cd airi
# 安装依赖
pnpm install
# 获取 Rust 依赖(可选,用于原生模块)
cargo fetch
# 启动网页版开发服务器
pnpm dev
# 或启动桌面版
pnpm dev:tamagotchi

方法四:Nix Flake#

Terminal window
nix run github:moeru-ai/airi

初次启动与配置#

无论是桌面版还是网页版,首次启动后都需要完成以下几步配置才能开始对话。

第一步:选择 LLM 提供商#

AIRI 支持 40+ 家 LLM 提供商。以下是几个推荐方案:

方案费用说明
OpenRouter按量付费聚合多家模型,支持信用卡/PayPal,适合海外用户
AIHubMix按量付费国内可访问,支持支付宝,推荐国内用户
DeepSeek极其便宜性价比极高,中文能力强,API 兼容 OpenAI
Ollama(本地)免费本地运行模型,无需联网,需有足够显存/内存
通义千问有免费额度阿里云提供服务,国内访问稳定
SiliconFlow按量付费国内平台,支持众多开源模型

设置路径:打开设置 → LLM 提供商 → 选择服务商 → 输入 API Key → 选择模型。

国内用户提示:AIHubMix、DeepSeek、通义千问、SiliconFlow 等国内服务无需特殊网络环境即可访问。如果使用 Ollama 本地部署,需设置环境变量 OLLAMA_ORIGINS=* 并重启 Ollama。

第二步:配置语音(可选)#

要实现语音对话,需配置 TTS(语音合成)和 STT(语音识别):

组件推荐服务说明
TTSElevenLabs音质最佳,支持多语言,需 API Key
TTSOpenAI TTS质量好,使用 OpenAI API Key 即可
TTSEdge TTS(免费)通过 openai-edge-tts 项目免费使用
STT浏览器内置使用浏览器 Web Speech API,免费无需配置
STTOpenAI Whisper通过 OpenAI API 或本地部署

如果暂时不想配置语音,也可以直接使用文字聊天。

第三步:选择角色外观#

AIRI 支持两种角色模型格式:

  • Live2D:2D 角色模型,文件格式为 .model3.json
  • VRM:3D 角色模型,文件格式为 .vrm

AIRI 自带一套默认角色,你也可以导入自己的模型。在设置中上传模型文件即可生效。

如何获取模型? 社区分享网站如 VRoid HubBooth 上有大量免费和付费模型。也可以从 AIRI 官方 Discord 社区获取推荐资源。

第四步:开始对话#

配置完成后即可开始对话:

  1. 在聊天输入框中输入文字,按回车发送
  2. 如果配置了语音,点击麦克风按钮开始说话
  3. AIRI 会通过 Live2D/VRM 角色做出表情和嘴型同步

默认情况下 AIRI 在”悬停时淡化”模式下运行。如果不习惯,可以在设置中关闭此选项,让角色常驻显示。

核心功能使用#

实时语音对话#

完成 TTS 和 STT 配置后,AIRI 支持全双工语音对话:

  1. 浏览器输入:在网页版中直接通过麦克风采集音频
  2. Discord 输入:在 Discord 语音频道中说话,AIRI 会自动听取并回复

语音处理流程:VAD(语音活动检测)→ STT(语音转文字)→ LLM(生成回复)→ TTS(文字转语音)。

多平台聊天#

AIRI 不仅可以在桌面端使用,还支持:

平台功能配置方式
Discord文字 + 语音聊天创建 Discord Bot Token,在 AIRI 设置中关联
Telegram文字聊天创建 Telegram Bot Token,关联 PostgreSQL + pgvector
Web 浏览器完整功能直接访问 airi.moeru.ai
移动端PWA 或通过 Capacitor添加到主屏幕使用

游戏联动#

AIRI 可以自主学习玩游戏,目前支持:

Minecraft:通过 mineflayer 库连接,AIRI 作为机器人进入你的 Minecraft 服务器,可以聊天、移动、交互。

Terminal window
# 在 AIRI 设置中配置 Minecraft 服务器地址和账号即可

Factorio:通过 RCON API 连接 Factorio 服务端,AIRI 可以观察并操作游戏。

游戏联动功能需要额外配置,具体请参考官方文档中的相关章节。

进阶使用#

AIRI Cloud 账号系统#

v0.10.1 起 AIRI 支持账号系统:

  • 使用邮箱注册,支持验证邮箱、重置密码
  • 可关联社交账号登录
  • 支持服务端 TTS(按角色按流量计费)
  • 可在设置中删除账号

插件系统#

AIRI 提供插件 SDK,支持开发自定义功能:

插件类型说明
Kits API工具调用,让 AIRI 执行特定操作
Bindings API绑定系统功能
Gamelet API游戏集成接口
MCP 协议通过 Model Context Protocol 接入外部工具

插件可从设置中安装和管理。MCP 工具的配置界面在 v0.10.2 中进行了重构,支持 JSON 编辑、连接测试和开关控制。

记忆系统#

AIRI 内置了基于浏览器的数据库支持,用于存储对话历史:

  • DuckDB WASM:浏览器内嵌入式数据库
  • pglite:轻量级 PostgreSQL 兼容方案
  • Memory Alaya:新一代记忆系统(开发中)

记忆功能让 AIRI 能够记住之前的对话内容,提供更连贯的交互体验。

AIRI 支持图像生成功能,通过配置图像生成提供商(如 ComfyUI、Replicate 等),可以让 AIRI 在对话中生成图片。

图像生成需要额外配置对应的 API 服务。

调优建议#

项目建议
LLM 模型选择聊天用 DeepSeek V3(性价比高)/ Claude Sonnet(质量好);中文场景优先 DeepSeek 或通义千问
TTS 服务ElevenLabs 音质最好但需付费;Edge TTS 免费且质量可接受
角色模型VRM 比 Live2D 更灵活(3D 支持更多动画);文件大小建议控制在 50 MB 以内
本地 Ollama至少 8 GB 显存运行 7B 模型,16 GB 运行 13B+ 模型;设置 OLLAMA_ORIGINS=* 避免跨域问题
国内网络优先使用 DeepSeek / SiliconFlow / 通义千问 等国内 API;GitHub Release 下载慢时可尝试镜像

常见问题#

Q:打开后一片空白/无法加载

确保浏览器支持 WebGPU。Chrome 113+ 和 Edge 113+ 默认支持,Firefox 需在 about:config 中启用 dom.webgpu.enabled

Q:AIRI 没有说话/没有声音

检查 TTS 配置是否正确:

  1. 确认已填写有效的 TTS API Key
  2. 确认选择了正确的语音模型
  3. 检查系统音量设置
  4. 在设置中测试 TTS(部分界面提供试听按钮)

Q:LLM API 报错/无法连接

  1. 确认 API Key 未过期且有余额
  2. 检查选择的模型名称是否正确
  3. 如果使用 Ollama,确保 OLLAMA_ORIGINS=* 已设置并重启服务
  4. 国内用户优先选择国内 API 服务商

Q:国内下载安装包很慢

GitHub Releases 下载在国内可能较慢。建议:

  • 使用代理下载
  • 或通过源码构建(git clone 可使用国内镜像加速)
  • 或直接使用网页版 airi.moeru.ai

Q:如何导入自己的 Live2D/VRM 模型

  1. 在设置中找到「角色模型」或「Body」设置项
  2. 点击上传按钮,选择 .model3.json(Live2D)或 .vrm(VRM)文件
  3. 上传后 AIRI 会自动加载并显示新模型

Q:AIRI 能不能在手机上用

可以。网页版支持 PWA,在浏览器中访问 airi.moeru.ai 后添加到主屏幕即可。另外项目还通过 Capacitor 提供了移动端版本(pnpm dev:pocket)。

使用限制与伦理声明#

AIRI 是一个开源工具,用户应遵守以下原则:

  • 不得使用 AIRI 冒充真人进行欺诈或虚假信息传播
  • 在使用声音克隆功能时,应获得被克隆者的明确同意
  • 遵守所使用的 LLM API 和 TTS 服务的服务条款
  • 遵守所在国家和地区的法律法规

参考资源#

AIRI 使用教程:搭建你的专属 AI 虚拟伴侣
https://blog.syomega.top/posts/airi-usage-guide/
作者
酱w
发布于
2026-05-19
许可协议
CC BY-NC-SA 4.0