比人工还准确!看深度学习如何对源码进行分类

  • 时间:
  • 浏览:1

编程语言是软件开发行业的主要工具。自20世纪40年代以来,原因分析分析分析出显 了数百种编程语言,有之前 每天全是少许的各种编程语言的代码被推送到代码库中。

人们人们人们 认为,根据代码识别编程语言的源代码分类器将是一1个多 非常有用的工具,原因分析分析分析它可用于在线自动语法高亮和标签建议,比怎么能用在StackOverflow和技术维基网站上。你这人想法能助 人们人们人们 根据最新的AI技术编写一1个多 对代码片段妙招编程语言进行分类的模型。

人们人们人们 根据编程语言的受欢迎程度选者了其中的一偏离 。图1显示了2014年第四季度GitHub上最常用的49种语言[1]。此分析仅考虑活跃

人们人们人们 使用GitHub API从GitHub上分发了数十万个源代码文件。在训练模型之前 ,还要补救原始数据以消除和减少你这人不还要的价值形式。最终完成的分类器的性能非常得好,你都还要在本文结尾找到相关的结果,以及有关模型决策的你这人解释。