传统的文本可读性度量方式,往往忽略了词汇的前后搭配顺序。我们在朴素贝叶斯的假设下,即假设文本中句子相互独立,并考虑句中词汇的前后搭配顺序,将文本中各个句子生成概率乘积的对数似然的均值,作为此文本的可读性度量。具体参考wingo文构财经文本数据库
参考文献Shin, Donghyuk et al. (2020). Enhancing Social Media Analysis with Visual Data Analytics: A Deep Learning Approach. MIS Quarterly. 44. 1459-1492.