Muji's homepage | Muji learning record

Google Storybook 来了解西方神话故事方便吗

每个人的绘本制作工具
By Muji
Posted on August 11, 2025

最近，谷歌新推出的 Storybook 工具吸引了我的注意。这款工具能根据用户需求快速生成图文并茂的绘本故事。作为一个对新产品充满好奇心的人，最近正好想了解西方神话故事，我立刻想到一个问题：它能否成为我了解西方神话故事的便捷工具？ [Read More]
Tags:
- Product
- tools
- LLM
- text2image
大模型时代，如何用AI筑牢内容安全的防线
By Muji
Posted on July 27, 2025

为什么各大平台如此重视内容安全 [Read More]
Tags:
- LLM
- VLM
- security
- Product
- Eval
NoteBook LM 好玩在哪里

人人可用的学习点播平台
By Muji
Posted on May 31, 2025

作为日常都要听播客的用户，之前就有使用体验 notebookLM，作为自己不想用眼睛看文章，但又想了解大致内容，提供新视角的听力资源补充。碰巧近期看完 Google IO 2025后发现 notebook LM 现在支持中文语言输出，而且也新发了移动端app，就想着正好和新推出的 Orange 橘子哥的 AI 播客产品 ListenHub 使用体验结合起来一起聊下使用感受。 [Read More]
Tags:
- Product
- tools
- voiceAI
- LLM
- TTS
大模型tts语音合成模型怎么选？
By Muji
Posted on April 15, 2025

在人工智能领域，语音合成技术（Text-to-Speech，简称 TTS）一直是研究的热点方向之一。早期的TTS主要应用于特定场景下的语音播报，比如火车站的到站通知、气象预报等。虽然可以完成基本的文本到语音的转换，但合成的语音往往机械、生硬，缺乏自然度和表现力。随着技术的进步，TTS 在智能客服、数字人播报、有声读物、导航系统等领域得到广泛应用，极大地改善了人机交互体验。现在随着大模型应用场景越来越多样，大家除文本外其他模态的需求也越来越多。就语音合成的要求也越来越多样，比如伴随着LLM 流式输出，语音如何更低延迟的输出，比如如何用几秒的短音频复刻一个相似度极高的合成声音，比如在不同的应用场景的下语音合成的情感表现度能否根据文本语义更契合等等 [Read More]
Tags:
- TTS
- Product
- Eval
对话框发出的一个请求，模型要回答需要哪些步骤

为什么同一个模型能同时处理多个请求
By Muji
Posted on April 1, 2025

缘起新人培训时候的一位同学，在培训会上问了一个问题：模型训练好推理时都是固定的，为什么同一个模型在调用时候同时段可以处理不一样的问题，输出不同的答案？同时和朋友吃饭的时候，他也正好在问大模型是怎么根据不同人输入的文字生成不同回答的。 [Read More]
Tags:
- LLM
- API

Google Storybook 来了解西方神话故事方便吗

每个人的绘本制作工具

大模型时代，如何用AI筑牢内容安全的防线

NoteBook LM 好玩在哪里

人人可用的学习点播平台

大模型tts语音合成模型怎么选？

对话框发出的一个请求，模型要回答需要哪些步骤

为什么同一个模型能同时处理多个请求