本例模拟一个多标签文档分类问题.数据集基于下面的处理随机生成: 选取标签的数目:泊松(n~Poisson,n_labels) n次,选取类别C:多项式(c~Multinomial,theta) 选取文档长度:泊松(k~Poisson,length) k次,选取一个单词:多项式(w~Multinomial,theta_c) 在上面的处理中,拒绝抽样用来确保n大于2,文档长度不为0.同样,我们拒绝已经被选取的类别.被同事分配给两个分类的文档会被两个圆环包围. 通过投影到由PCA和CCA选取进行可视化