众所周知,Bilibili会在分享链接中加上与分享者有关的参数,这样在其他人通过链接点进内容时,便可自动关联二者的账号,从而在算法上实现精准推送,这就是为什么有时你能在B站刷到某位群友的视频或是在推荐关注列表里发现他的账号。 上图为在网页中获得的分享链接,正是vd_source参数暴露了分享者信息。 有人或许已经为了不泄露隐私开始有意地在分享前删去…
仅记录自身学习过程,不适合作为教程浏览 数据搜集 在Kaggle(Find Open Datasets and Machine Learning Projects | Kaggle)等网站上下载数据集,或是自行用爬虫爬取 数据清洗 下载下来的数据往往存在大量重复或不符合要求的低质/主题无关图像,需要进行一定处理才可用于训练。由于此次目的仅在于跑通整…
在上一篇学习日志中,我介绍了GSV的API食用方法,本篇我们研究如何将LLM与GSV对接。 这乍一听很简单,只需要将大模型返回的结果简单处理之后交由GSV处理之后就行了……对吗?思路没问题,确实是可行的,不过由于GSV处理文字的时间过长,这导致实际延迟时间过长,体验极差。 我们真正想要的效果是这样的:让GSV处理完一部分音频后就立即播放,剩下的边播…
最近换了电脑,终于可以试试GSV和RVC了。在简单体验一番后,萌生了将其与LLM结合起来的想法。 (毕竟谁不想让AI用自己喜爱的虚拟角色的声音说话呢 实现方法也简单,官方已经提供了API,只需要把LLM输出的话用它处理一遍就好了。(当然,考虑到TTS需要消耗一定时间,还需要对句子进行拆分,分段进行流式输出。) API 以v2版本为例,要想使用GSV…
24年年底,因为deepseekV3的爆火,我开始注意到这样一个来说性价比极高的大模型,于是第一时间将其接入了此前编写的QQ机器人插件中。最近几周,随着R1版本的发布,我又有了尝试本地部署蒸馏版本的想法(不过估计最多到14B Xp)。此外我也有一些让其对话风格更加近似于人类的想法,将在近期进行尝试。 from openai import OpenA…
成为了大学牲,才发现每天的生活并没有之前所想象的那样轻松,不同于高中时期那种大部分时间都被学习一件事所挤占的忙,大学除了学习,还会被许多稍显琐碎的杂事所困。各种会议、活动、通知,QQ群成为了获取这些消息几乎唯一的渠道,各种群加了又加,消息一天到晚弹个不停,尽管我会尽力及时查看每一条通知,然而有时还是难免疏忽。查看以往的通知也很麻烦,它们夹杂在无用的…