0%

A semi-supervised machine learning framework for microRNA classification

摘要

本文探讨了半监督机器学习在miRNA分类中的应用,以最大限度地利用标记数据和未标记数据。我们在这里提出了两种半监督方法的新组合:主动学习和多视角联合训练。在6个不同物种上的结果表明,这阶段半监督方法能够使用非常少的标记实例来提高分类性能,有效地利用了可用的未标记数据。

提出的半监督miRNA分类管道有潜力以高查全率和精度识别新的miRNA,同时需要非常少量的已知miRNA。这种方法在研究小生境物种新测序基因组中的miRNA时非常有益,因为已知的miRNA例子很少。

阅读全文 »

Deepinsight: A methodology to transform a non-image data to an image for convolution neural network architecture

将非图像数据转换为可以可视化的图像

将特征向量根据特征之间的相关性等,改变其位置,构成新的特征矩阵,该特征矩阵找到的是各特征在矩阵中的位置!

阅读全文 »

基于表示学习和深度森林的 lncRNA 编码短肽预测模型

深度神经网络DNN,同分布取样,筛选起始密码子为ATG,去冗余,

针对短肽预测研究中 lncRNA 中 sORFs 特征不鲜明且高可信度数据尚不充分的问题,提出一种基于表示学习的深度森林模型

提出一种自动编码器(AE)与深度森林结合的方法,实现lncRNA编码短肽的识别预测。

本文的主要贡献如下:

1)使用多个生物信息学软件获取拟南芥中的 sORFs,对结果取交集以提高结果可信度。

2)提取 CDS 与 NCDS 候选 sORFs 序列在多种特征编码方式下的特征表达结果,对特征进行融合,并通过机器学习算法分析二者的差异。

3)结合自动编码器非监督表示学习思想,提出一种深度森林预测模型,实现 sORFs 编码短肽的识别预测。

阅读全文 »

主动学习通过一定的算法查询最有用的未标记样本,并交由专家进行标记,然后用查询到的样本训练分类模型来提高模型的精确度。

不同于被动学习被动的接受知识,主动学习能够选择性地获取知识。

如何从中挑选出对训练贡献度高的样例,标注后补充到训练集中来提升分类器性能是主动学习研究方向之一。

阅读全文 »

题目描述

给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。

给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。

示例:

输入:”23”
输出:[“ad”, “ae”, “af”, “bd”, “be”, “bf”, “cd”, “ce”, “cf”].
说明:
尽管上面的答案是按字典序排列的,但是你可以任意选择答案输出的顺序。

阅读全文 »

图解深度学习

作者:山下隆义

深度学习的起源包括感知器和玻尔兹曼机,

起源于感知器的深度学习属实有监督学习,

起源于受限玻尔兹曼机的深度学习属于无监督学习

阅读全文 »