手机浏览器扫描二维码访问
作为一名合格的科研工作者,谢与非首先开始做文献收集工作。
Sci-Hub是用不了了,KI上的文献也不算很多,于是谢与非只好从最基础的做起——先筛选知名小说网站和APP。
不多时就进入到了着名的网文论坛,从中筛选出基本符合要求的平台若干。
然后再细分,哪些网站以霸总小白文见长,哪些受众比较多样化。
接着呢,就是科研狗们最喜欢的收集数据阶段。
谢与非花了两个晚上,研究了各类榜单的排名和更新依据,从论坛里搜集了大量资料,甚至搞明白了几大平台女频的各种打榜暗箱操作。
于是她——开始看小说了?
不,蠢蠢欲动想要写个刷票小程序和网站的算法较量一下,看能不能被识破。
但是理智告诉她,做研究要不忘初心,总结霸总的行为规律才是首要任务,于是又回归到了霸总文本身。
开始的时候,谢与非做了个Excel表,里面列了各个网站排名前十的霸总文,并且按照简介和名字做了分类。
通过阅读大量的书评,扫文号和论坛讨论贴可知,霸总文只是一个大项目,里面还分有不同的小类与流派。
根据题材可以分为重生,穿越,现实,古代等等,穿越下面还有,等小类。
根据风格还可以分为「甜宠型」,「强迫型」,「型」,「契约情人型」等等。分析平台的榜单排名可知,目前「虐恋型」已经过时,「甜宠型」和「火葬场型」正在当红。
表列到这里,谢与非发现单纯的表格已经不能满足她了,这种复杂的分类需要一个坐标系。
于是画起了横轴和纵轴。
除了文章风格,作为霸总文灵魂的「霸总」当然也需要分类。
什么型霸总,粗暴型霸总,外冷内热型霸总,智商极高型霸总,反正也是需要一个坐标系来画明白的。
画着画着图她的思维又开始奔逸了,像霸总文这种具有高度同质性并且特徵明显的小说,是不是可以先收集大量数据建立一个语料库,然后再写一个算法让AI自动出产霸总文,只要输入想要的属性标签,然后就可以自动从语料库里摘取句子生成语段。同理可证那些打脸文丶丶文都可以一样产出。
小贴士:如果觉得不错,记得收藏网址或推荐给朋友哦~拜托啦(.)
:||
瑞雪临 万人迷黑月光决定死遁 影后娘娘升职记 魔王她沉迷当厨子[废土] 暴风雪来临:开启末世零元购 夏至玫瑰 首席生活玩家[全息] 我在哥谭嘎嘎乱杀[综英美] 请认真搞笑 迟迟动心 女配跳灭仙崖之后 在年代文离婚后的幸福生活 欲拒还迎后男主精分了 绿茶女配的前男友们 谁抢了我的恋爱脑剧本 七十年代创业忙 规则怪谈但自带老婆 领主模拟器[基建] 星际第一符籙机甲师 御厨大人她有新派料理[美食]
21世纪的现代女性,一朝穿越。一心搞事业的我,要爱情作甚。谁也不敢惹太悲催,谁也惹不起简直太爽了。攻略王爷,专心助他打江山!哇,终于找到机会跑路了!...
前世周勇因上门女婿的身份,毅然决然与妻子离了婚,酿成无法挽回的悲剧!本以为再无弥补机会,不想死亡即是重生的开始。这一世周勇本想过老婆孩子热炕头的生活,然而现实却总是充满了变数。当命运齿轮缓缓开启的那一刻,注定他要踏上一条不平凡的路。他的重生改变了无数人的命运,他的重生更改变了一个村的命运。大浪淘沙,且看周勇如何在一...
万古神魔卷简介emspemsp关于万古神魔卷万古神魔卷无意间穿越到天斗大陆,万般不幸降临一身。偶然觉醒一张神秘古卷,从此身藏神与魔,弹指山河变,挥手天地崩。首发yuzhaiwupwpo1⒏υip...
星海漫游,时空穿梭,机械科技,目标是未知的星辰大海!如果您喜欢全能科技巨头,别忘记分享给朋友...
套路不成反被套简介emspemsp关于套路不成反被套为了给著名作家留下个好印象,诚意满满开车去接人谈合作的沈总,结果被告知大作家她恐速。沈总表示,恐速没关系,弹射起步了解一下然后,就没有然后了。沈总哎,你真恐速啊?初语呵...
穿越兽世小巫娘,生崽崽简介emspemsp摔进兽人世界还成了即将入口储备粮?白清清欲哭无泪,附带一个大巫系统,以为要手握金手指成为兽世大巫了,结果债台高筑欠了系统一屁股债,白清清泪流满面。还好听说这里雌性稀少且备受宠爱?还好还好,有淳朴...