如何以极低成本微调轻量化大模型
如何以极低成本微调轻量化大模型很多自称自研的模型其实只是借助SFT(监督微调,Supervised Fine-Tuning),用一张消费级显卡和极低的边际成本实现的。
微调后的模型“深度蒸馏”后能实现手机端离线运行,也能免去每次输入冗长Prompt的繁琐。严格来说只有从0预训练一个大模型才能叫自研模型。
第一步:高质数据集的构建数据质量直接决定了微调的成败。质量大于体量。
数据提取:整理你需要AI学习的原生文本(文章、随笔或对话记录),提取你想要喂给AI的原始语料(建议初始50条以上)。
Instruction-Response:将原生文本转化为大模型可读的“指令-回复”对。
Data Augmentation:由于原生数据有限,可编写自动化脚本,调用主流大模型API(如Qwen或DeepSeek),以你的原生数据为Few-Shot样本,将其扩充至200~500条,强化模型训练的稳定性。
自动化质检与标注(俗称打标):利用便宜的国产模型(如DeepSeek-V4)构建一个工作流,对扩充后的数据进行打分与清洗。重点审查:
遣词造句是否符合你的需求;
是否存在语病或逻辑断层;比如及 ...
梅花
———
最近游玩《浪人崛起》时,游戏里有预测“单双”的元素。顺手用术数实践了一下,过程中产生了一些有趣的思考,想记录下来。当时在游戏里预测“单双”,我起了几个卦都没有预测准确。第一反应当然是怀疑自己:不应该啊。后来验证结果时才发现,事情更有意思。预测“单双”这种二元结果,本质属于“极简取象”。是对当下倾向的极简判断,不是看大局和分析复杂因果。
在这种场景里,我的首选一直是:梅花易数 / 六爻(简化使用)。尤其是承袭了康节先生先天象数神髓的梅花,就是为了轻量级占断而生的。取象直接,不需要过度结构化分析。不容易出现“过拟合”。
我知道游戏里的随机机制并非真正的自然随机,但后来才知道,当时没有算准的原因,是游戏里的庄家作弊了(主线剧情强制)。
后续的一些验证这也让我得出一个更清晰的结论:术数是完全可以用在电子游戏以及漫画小说里的,包括我很久之前就说过的虚拟人物的生辰八字,同样可以推演。“虚拟或现实”,根本不重要。
但如果需要在短时间内反复起卦,且对应的是一个“声称随机、但你无法验证其生成机制的系统”,那么起卦方式就很关键。这种情况下,应以随机数起卦,而不是农历时间起卦。因为时间起卦 ...
Under a Streetlight, I Forgot My Name
It was my first winter in Germany — I was 18 at the time.
One evening, a friend introduced me to someone.They said their name. I nodded slightly — and that was it.
Under a dim streetlight, with a few snowflakes drifting down,I completely forgot to introduce myself.
There was a brief silence.Not awkward, not intentional — just… empty.
It wasn’t until later that my friend mentioned it,and I realized how it might have come across.
Cold, perhaps. Or distant.
I didn’t mean to be.
But I’ve come to und ...
河洛
已删除
中国术数根本基础结
中国术数体系的理论基础其核心根源于阴阳与五行。结束。
后世学者又基于此衍化出天干地支、河洛数理等多种理论,彼此交织,相辅相成。无论是《易经》中的太极生两仪,还是《黄帝阴符经》、《太乙金镜》、《滴天髓》、《皇极经世》等经典皆围绕”阴阳五行”的宇宙观展开论述,天、地、人三才互为关联、阴阳互推相生,循环不息,五行运化,由此衍生出命理、风水、占卜等术数门类。
五行的本质可以理解为能量运动的”方向”,简而易之。
按照从无极到太极,又分化为阴阳二气(两仪)我应该从微观到宏观给你们解释阴阳的本质再解释五行的本质。然而此法有违直观与人脑逻辑,故不若自外而内、自大而小,循序渐进以启悟。
阴阳的本质阴阳的本质不是某种物质,以目前的科学可以理解为一种二相极性振荡无极(太极)到两仪(阴阳)、再到万象生化的动态法则;可视为不同频率和相位的能量场,通过周期性共振推动万物及其秩序的生成与演变。
我说过五行的本质可以理解为能量运动的”方向”,那么阴阳则是构成这些运动的极性与振动模式,是能量—频率—共振这一普遍规律在中国古典哲学中的映射解释。
衍化与模型在此至理之上,诸多术数模型应运而生:各具侧重,却无一例外遵循阴阳五 ...
八字技法
目录1.如何通过八字看一个人的原局人品如何,值不值得深交,还是只能在特定的方面接触2.大运流年加上定盘,判断当下这个人的人品心性3.定盘的具体几种方法4.流年干支具体分析:命主短期心性变化5.十神分析:全面剖析人格与情感 命主对什么人分别倾向于什么态度6.综合分析:多维度判断人品与心性已删除
八字理法
1.五行由来2.阴阳由来3.干支由来4.纳音由来5.四柱八字排盘方法,时间根本不是用真太阳时间6.早晚子时的根本7.禄命法和子平的不同8.到底要不要算命,什么情况下可以算9.如何辨别师傅的真假水平,如何鉴别网络骗子水货,给多少卦金合理10.案例分析11.书籍推荐已删除
BaZi Case Backup
已删除我一切在网络上发表过的八字都是经过当事人同意或者是名人公开的八字给大家分析理法用的,不对人。我没有保存排的盘的习惯,但如果我算了一次就记住你的盘了,那也咩办法哈。目前我也不怎么看八字紫微了。
BaZi Case Study 106-Female
Preview
Hi
Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick StartCreate a new post1$ hexo new "My New Post"
More info: Writing
Run server1$ hexo server
More info: Server
Generate static files1$ hexo generate
More info: Generating
Deploy to remote sites1$ hexo deploy
More info: Deployment
Local startup test1$ hexo cl; hexo s
Upload Github1234$ hexo clean; hexo generate; hexo deploy // VSC ...