java – 如何确定字符串是英文句子还是代码?

前端之家收集整理的这篇文章主要介绍了java – 如何确定字符串是英文句子还是代码?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
考虑以下两个字符串,第一个是代码,第二个是英语句子(短语是准确的).如何检测第一个是代码而第二个不是代码.
1. for (int i = 0; i < b.size(); i++) {
2. do something in English (not necessary to be a sentence).

我正在考虑计算特殊字符(例如“=”,“;”,“”等),并设置是否达到某个阈值.有没有更好的方法来做到这一点?任何Java库?

请注意,代码可能无法解析,因为它不是完整的方法/语句/表达式.

我的假设是英语句子非常规则,它很可能只包含“,”,“.”,“_”,“(”,“)”等等.它们不包含这样的东西:写(“整体很多文字“);

解决方法

基本思想是将字符串转换为设置为标记.例如,上面的代码行可能变为“KEY,SEPARATOR,ID,ASSIGN,NUMBER,……”.然后我们可以使用简单的规则将代码与英语分开.

check out the code here

猜你在找的Java相关文章