进行搜索-228-基于云计算的电子政务公共平台管理规范第1部分:服务质量评估(gb_t 34077.1-2017)
通常搜索会在[min,max)下取步长0.1进行搜索2.5.2选择子集subset.py(libsvm) 1.说明此函数为从大数据集总选择较小的子集。此工具由Chih-Jen Lin提供2.调用示例: Usage: %s [options] dataset number [output1] [output2] python subset.py –s 0 data.txt 3000 output1.txt output2.txt即从data.txt中选择3000个样本,并将选择的子集输出到output1.txt,其余的部分输出到output2.txt中。其中参数-s如果为0,则子集选择为分层抽样,即子集仍然会保持原数据集中各个类的比例。如果-s为1,则从源数据集中随机选择,不会考虑各个类的比例。 3.输入格式1)如果设置-s 0则,需要以下输入格式:第一列为类别,如果为binary分类。最好Positive为1,Negative为-1。如果为多分类,正常样本为-1,其余的类可以选择1,2,3,4……其余列为内容,可以有多列内容。 2)如果设置-s 1,则输入格式没有限制4.结果选择的子集输出到output1.txt,其余的部分输出到output2.txt中5.参数说明: -s子集选择的方法,默认为0 0 –分层抽样1 –随机选择output1 :子集的输出(optional) output2 :剩余部分的输出(optional)
591.34KB
文件大小:
评论区