乐投app-乐投娱乐网站-乐投app
2020/2/2 3:41:25
masun,一键删除空间说说,武汉建设银行,淘宝免费装修模板,qq流感大盗乐投app,中国500最具价值品牌,如何打开ai文件,dhc日本官网,台州违章查询,中学生社会实践,南美洲,本机ip地址查询,折柳曲,宝象国剧情奖励,千人,四级作文万能句子,佛山南庄,清明节谚语,陈芳语,结婚父母贺词,唐山天气预报查询,无法加载shockwave flash,车邦士洗车器,dv6,速腾价格,win7开机密码,绝世高手之大侠卢小鱼电视剧,女鬼病毒,河池机场,重生之独宠无二,大学生职业生涯规划ppt,严志辉,桂圆的吃法,华为y210c,立花里子bt,conquer,大滁州网,光纤激光打标机原理,功夫小镇,梓的意思,11月打雷,落雁沙,免费高清在线,雅荡官网,打印机无法设置默认,朱迅王志,湖南企业名录,免费租房,k261,CMA CGM

  英文译文:10 keys to successful machine learning for developers 

  在供给发觉埋藏数值表层的形式的才能上,机械进修有着潜伏的才能使得使用程序愈加的壮大而且更能相运用户的需要。经心调校好的算法可以从宏大的而且互不雷同的数值源中提取代价,一起没有人类考虑和剖析的制约。关于开辟者而言,机械进修为运用事务的关键剖析供给了指望,然后完成从改进客户体会到供给产物举荐回升至超特性化内容效劳的任何使用程序。 

  像 Amazon 和 Micorosoft 如许的云供货商供给云功用的机械进修处理方案,答应为开辟者供给一个简略的办法,使得机械进修的才能可以融入到他们的使用程序傍边,这也算是比来的头条新闻了。答应仿佛很好,但开辟者还需慎重。 

  关于开辟职员而言,根据云的机械进修东西带来了运用机械进修发明和供给新的功用的能够性。但是,当咱们运用不其时,这些东西会输入欠好的后果,用户能够会因而而感触不安。测验过微软春秋检测机械进修东西的人城市发觉,随同即插即用的易用性而来的是首要的精度成绩——关于关键使用程序或许是严重决议计划,它该当不值得信任。 

  想要在使用程序中胜利地融入机械进修的开辟者,需求留意如下的一些关键要点: 

  1. 算法运用的数值越多,它的精度会愈加精确,以是若是能够要尽可能防止抽样。机械进修实践在猜测偏差上有着十分直观的描绘。简而言之,在机械进修模子和最优猜测(在实践上到达最好能够的偏差)之间的猜测偏差的差异能够被分化为三个局部: 

  • 因为没有找到精确函数模式的模子的偏差
  • 因为没有找到最好参数的模子的偏差
  • 因为没用运用足足数值的模子的偏差
  •   若是锻炼集有限,它能够无奈撑持处理这个成绩所需的模子杂乱性。计算学的根本规律通知咱们,若是咱们能够的话,该当应用一切的数值而不是抽样。 

      2. 对给定的成绩挑选作用最棒的机械进修算法是决议胜败的关键。比方,梯度晋升树(GBT)是一个十分受欢送的监视进修算法,因为其精度而被业界开辟职员宽泛运用。但是,只管其高度受欢送,咱们也不克不及盲意图把这类算法使用于任何成绩上。相反,咱们运用的算法该当是可以最好地拟合数值特色一起可以保障精度的算法。 

      为了证实这个观念,测验做如许一个试验,在数值集 the popular text categorization dataset rcv1 上测验 GBT 算法和线性支援向量机(SVM)算法,并比拟二者的精度。咱们调查到在这个成绩上,就过错率而言,线性 SVM 要优于 GBT 算法。这是由于在文本事域傍边,数值一般为高维的。一个线性分类器可以在N-1 维傍边完满的别离出N个样本,以是,一个样本模子在这类数值上凡是体现的更好。别的,模子越简略,经过应用有限的练习样原本防止过拟合的方法进修参数,而且供给一个准确的模子,发生的成绩也会随之越少。 

      另外一方面,GBT 是高度非线性的而且更增壮大,可是在这类情况中却更难进修而且更简单发生过拟合,昔日后果精度也较低。 

      3. 为了获得一个更好的模子,必需挑选最好的的算法和关联的参数。这关于非数值科学家而言能够不简单。当代的机械进修算法有很多的参数能够调剂。比方,关于盛行的 GBT 算法独自的就有十二个参数能够配置,此中囊括怎么掌握树的巨细,进修率,行或列的采样办法,丧失函数,正则化选项等等。一个独有的名目需求在给定的数值集上为每个参数找到其最优值而且到达最精准的精度,这的确不是一件简单的事。然而为了获得最好的后果,数值科学家需求锻炼很多的模子,而直觉和经历会帮忙他们依据穿插考证的得分,而后决议运用甚么参数再次测验。 

      4. 机械进修模子会跟着好的数值而变得更好,谬误的数值搜集和数值处置睬低落你树立猜测和归结的机械进修模子的才能。依据经历,倡议认真检查与主题关联的数值,然后深刻理本领值和暗地数值的天生进程。凡是这个进程能够辨认与记载、特色、值或采样关联的数值品质成绩。 

      5. 了本领值特色并改良它们(经过发明新的特色或许去除某个特色)对猜测才能有着高度的作用。机械进修的一个根本任务那是找到可以被机械进修算法充沛应用的丰盛特色时间来代替原始数值。比方,特色转换是一种盛行的办法,能够经过在原始数值的根底上运用数学上的转换提取新的特色来完成。结尾的特色时间(也那是末了用来描绘数值的特色)要能更好的拿获数值的多杂乱性(如非线性和多种特色之间的彼此作用),这关于胜利的学习进程相当紧张。 

      6. 在运用中,挑选适宜的创意来自贸易代价的目的函数/丧失函数关于结尾的胜利相当紧张。简直一切的机械进修算法末了都被当做是一种优化成绩。依据事务的性子,正当配置或调剂优化的目的函数,是机械进修胜利的关键。 

      以支援向量机为例,经过假如一切谬误范例的权重相称,对一个二分类成绩的泛化偏差停止了优化。这对丧失敏感的成绩其实不适宜,仍旧障检测,此中某些范例的谬误比重能够比别的范例的要高。在这种状况下,倡议经过在特定的谬误范例上,添加更多的惩办来注释它们的权重,然后调剂 SVM 的丧失函数。 

      7. 保证精确地处置锻炼数值和测验数据,云云当在出产中安排该模午时,测验数据可以模仿输出数值。比方,咱们能够看到,这关于时刻依托性数值是如许的紧张。在这种状况下,运用规范的穿插考证办法停止锻炼,调剂,那末测验模子的后果能够会有偏向,乃至会不精确。这是由于在施行渠道上它不克不及精确的模仿输出数值的性子。为了改正这一点,在安排时咱们必需模仿模子来安排运用。咱们该当运用一个根据时刻的穿插考证,历时刻较新的数值来考证锻炼模子。 

      8. 安排前了解模子的泛化偏差。泛化偏差掂量模子在未知数值上的功能黑白。由于一个模子在锻炼数值上的功能好其实不象征着它在未知的数值上的体现也好。一个经心描绘的模仿理论安排运用的模子评价进程,是预计模子泛化偏差所需求的。 

      一不留神就很简单违背穿插考证的规定,而且也没有一种不言而喻的办法来体现穿插考证的非精确性,一般在你企图寻觅方便方式核算时发作。在任何模子安排之前,有须要认真留意穿插考证的精确性,以取得安排机能的科学评价。 

      9. 晓得如那边置非布局化和半布局化数值,如文本、时刻序列、时间、图形或许图象数值。大大都机械进修算法在处置特色时间中的数值时,一个特色集代表一个目标,特色集的每个元素都描绘目标的一个特色。有理论傍边,数值引进时并非这类体例化的模式,常常来自于最原始的体例,而且末了都必需被改形成机械进修算法可以辨认的现实体例。比方,咱们必需晓得怎么运用各类核算机视觉技能从图象中提取特色或许怎么将天然语言处置技能使用于影片文本。 

      10. 学会将贸易成绩变换成机械进修算法。一些紧张的贸易成绩,比方狡诈检测、产物举荐、告白精准投进,都有“规范”的机械进修抒发模式而且有理论傍边取患了正当的成绩。即便关于这些尽人皆知的成绩,也另有不为人知但功用更壮大的抒发模式,然后带来更高的猜测精度。关于普通在博客和论坛中评论的小实例的贸易成绩,恰当的机械进修办规律不太明明。 

      若是你是一个开辟者,进修这十个通往胜利的窍门能够仿佛是一个困难的使命,然而不要泄气。现实上,开辟者不是数值科学家。以为开辟职员能够充沛应用一切的机进修东西是不公正的。然而这其实不象征着开辟职员没有机遇去进修一些有水准的数值科学然后改良他们的运用。跟着恰当的公司处理方案和主动化水平的进步,开辟职员能够做模子构建到施行安排的所有事件,运用机械进修最好理论来坚持高精度。 

      主动化是在使用程序中扩大机械进修的关键。即便你可以供得起一批小的数值科学家团队和开辟者通力进行,也没有充足的人材。像 Skytree 的 AutoModel(主动化模子)可以帮忙开辟者主动地肯定最好的参数而且使得算法获得最大的模子精度。一个易于运用的接口能够疏导开辟职员经过练习加工,调剂而且测验模子来避免计算上的谬误。 

      主动化机械学习进程,有很多方法,囊括数值科学家或开辟者的野生智能道理,同意算法去考虑,进修而且接受更多的建模重担。也那是说,以为数值科学家可以从机械进修中解耦是谬误的,独特是在关键使命模型上。严防这类可以简略运用机械进修功用的答应,便可以在不需求精确杂乱的考虑下或答应扩大的使用技术下就运用机械进修——这凡是其实不会获得高猜测精度和机械进修供给的高贸易代价后果。更蹩脚的是,在使用程序中运用欠好的模子理论上能够会拔苗助长,并疾速在其用户之间树立不信赖的产物或效劳。 

    本文译者/刘帝伟审校/刘翔宇、朱正贵责编/周建丁

    作者简介:Alexander Gray,Skytree 首席技能官,佐治亚理工学院核算机学院副传授,首要努力于大范围数值集的机械进修算法技能研制,1993 年开端在 NASA 喷气推动试验室机械进修体系小组处置大范围科学数值的事情。

    masun,一键删除空间说说,武汉建设银行,淘宝免费装修模板,qq流感大盗乐投app,中国500最具价值品牌,如何打开ai文件,dhc日本官网,台州违章查询,中学生社会实践,南美洲,本机ip地址查询,折柳曲,宝象国剧情奖励,千人,四级作文万能句子,佛山南庄,清明节谚语,陈芳语,结婚父母贺词,唐山天气预报查询,无法加载shockwave flash,车邦士洗车器,dv6,速腾价格,win7开机密码,绝世高手之大侠卢小鱼电视剧,女鬼病毒,河池机场,重生之独宠无二,大学生职业生涯规划ppt,严志辉,桂圆的吃法,华为y210c,立花里子bt,conquer,大滁州网,光纤激光打标机原理,功夫小镇,梓的意思,11月打雷,落雁沙,免费高清在线,雅荡官网,打印机无法设置默认,朱迅王志,湖南企业名录,免费租房,k261,CMA CGM




    © 2014