在做用户实名验证时,常会用到身份证号码的正则表达式及校验方案。本文列举了两种验证方案,大家可以根据自己的项目实际情况,选择适合的方案。
身份证号码说明
居民身份证号码,正确、正式的称谓应该是“公民身份号码”。根据【中华人民共和国国家标准 GB 11643-1999】中有关公民身份号码的规定,公民身份号码是特征组合码,由十七位数字本体码和一位数字校验码组成。排列顺序从左至右依次为:六位数字地址码,八位数字出生日期码,三位数字顺序码和一位数字校验码。
以北京市朝阳区一女性身份证号码为例,身份证号码所表示的含义如下图所示:
注:该身份证号码来源于国标【GB 11643-1999】。
下面我们就从零开始完成一个完整的身份证号码校验过程。
方案1 (简单)
1.1 分部规则
我们首先提出方案1,并分步做如下规则定义:
1.1.1 地址码规则:
- 地址码长6位
- 以数字1-9开头
- 后5位为0-9的数字
根据以上规则,写出地址码的正则表达式:/^[1-9]\d{5}/
1.1.2 年份码规则:
- 年份码长4位
- 以数字18,19或20开头
- 剩余两位为0-9的数字
根据以上规则,写出年份码的正则表达式:/(18|19|20)\d{2}/
。如果不需要18开头的年份,可以去掉18。
1.1.3 月份码规则:
- 月份码长2位
- 第一位数字为0,第二位数字为1-9
- 或者第一位数字为1,第二位数字为0-2
根据以上规则,写出月份码的正则表达式:/((0[1-9])|(1[0-2]))/
。
1.1.4 日期码规则:
- 日期码长2位
- 第一位数字为0-2,第二位数字为1-9
- 或者是10,20,30,31
根据以上规则,写出日期码的正则表达式 :/(([0-2][1-9])|10|20|30|31)/
。
1.1.5 顺序码规则:
- 顺序码长3位
- 顺序码是数字
根据以上规则,写出顺序码的正则表达式 :/\d{3}/
。
1.1.6 校验码规则:
- 校验码长1位
- 可以是数字,字母x或字母X
根据以上规则,写出校验码的正则表达式 :/[0-9Xx]/
。
1.2 方案1正则表达式
综合以上6条规则,给出完整的正则表达式及测试程序如下:
var p = /^[1-9]\d{5}(18|19|20)\d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$/;
//输出 true
console.log(p.test("11010519491231002X"));
//输出 false 不能以0开头
"01010519491231002X"));
//输出 false 年份不能以17开头
"11010517491231002X"));
//输出 false 月份不能为13
"11010519491331002X"));
//输出 false 日期不能为32
"11010519491232002X"));
//输出 false 不能以a结尾
"11010519491232002a"));
1.3 方案1分析
方案1只是做了基本的格式判定,存在三个主要的不足:
- 地址码判定不够精确。例:我国并不存在16,26开头的地区,却可通过验证
- 日期判定不够精确。例:19490231也可通过验证,而2月并不存在31日
- 校验码是由17位本体码计算得出,方案1并未校验此码
方案2 (全面)
根据方案1的不足,引入方案2进而改进方案1的不足。
2.1 省级地址码校验
华北:北京11,天津12,河北13,山西14,内蒙古15
东北: 辽宁21,吉林22,黑龙江23
华东: 上海31,江苏32,浙江33,安徽34,福建35,江西36,山东37
华中: 河南41,湖北42,湖南43
华南: 广东44,广西45,海南46
西南: 四川51,贵州52,云南53,西藏54,重庆50
西北: 陕西61,甘肃62,青海63,宁夏64,新疆65
特别:台湾71,香港81,澳门82
根据上述地址码做身份证号码的前两位校验,进一步的提高准确率。当前的地址码以2013版的行政区划代码【GB/T2260】为标准。由于区划代码的历史演变,使得地址码后四位校验变得不太可能。以三胖的身份证号为例,本人号码是2321开头,而当前行政区划代码表中并无此代码。因此本文只做前两位省级地址码的校验。
也有说法表述91开头是外国人取得中国身份证号码的前两位编码,但本人并未得到证实。如有持91开头身份证或认识马布里的,请帮忙确认相关信息。
根据以上分析,给出省级地址码校验及测试程序如下:
var checkProv = function (val) {
var pattern = /^[1-9][0-9]/;
var provs = {11:"北京",12:"天津",0);font-weight:bolder;">13:"河北",0);font-weight:bolder;">14:"山西",0);font-weight:bolder;">15:"内蒙古",0);font-weight:bolder;">21:"辽宁",0);font-weight:bolder;">22:"吉林",0);font-weight:bolder;">23:"黑龙江 ",0);font-weight:bolder;">31:"上海",0);font-weight:bolder;">32:"江苏",0);font-weight:bolder;">33:"浙江",0);font-weight:bolder;">34:"安徽",0);font-weight:bolder;">35:"福建",0);font-weight:bolder;">36:"江西",0);font-weight:bolder;">37:"山东",0);font-weight:bolder;">41:"河南",0);font-weight:bolder;">42:"湖北 ",0);font-weight:bolder;">43:"湖南",0);font-weight:bolder;">44:"广东",0);font-weight:bolder;">45:"广西",0);font-weight:bolder;">46:"海南",0);font-weight:bolder;">50:"重庆",0);font-weight:bolder;">51:"四川",0);font-weight:bolder;">52:"贵州",0);font-weight:bolder;">53:"云南",0);font-weight:bolder;">54:"西藏 ",0);font-weight:bolder;">61:"陕西",0);font-weight:bolder;">62:"甘肃",0);font-weight:bolder;">63:"青海",0);font-weight:bolder;">64:"宁夏",0);font-weight:bolder;">65:"新疆",0);font-weight:bolder;">71:"台湾",0);font-weight:bolder;">81:"香港",0);font-weight:bolder;">82:"澳门"};
if(pattern.test(val)) {
if(provs[val]) {
return true;
}
}
false;
}
//输出 true,37是山东
console.log(checkProv(37));
//输出 false,16不存在
16));
2.2 出生日期码校验
出生日期码的校验不做解释,直接给出如下函数及测试程序:
var checkDate = /^(18|19|20)\d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)$/;
var year = val.substring(0,0);font-weight:bolder;">4);
var month = val.substring(4,0);font-weight:bolder;">6);
var date = val.substring(6,0);font-weight:bolder;">8);
var date2 = new Date(year+"-"+month+"-"+date);
if(date2 && date2.getMonth() == (parseInt(month) - 1)) {
console.log(checkDate("20180212"));
//输出 false 2月没有31日
"20180231"));
2.3 校验码校验
校验码的计算略复杂,先给出如下公式:
其中 ai 表示身份证本体码的第 i 位值,而 Wi 表示第 i 位的加权因子值。
加权因子表 【表1】:
i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | @H_551_403@ @H_794_404@
---|---|---|---|---|---|---|---|---|
Wi | 7 | 9 | 10 | 5 | 8 | 4 | 2 | 1 | @H_551_403@
11 | 12 | 13 | 14 | 15 | 16 | 17 | @H_551_403@||
6 | 3 | 2 | @H_551_403@
X与校验码换算表 【表2】
X | 0 | 8 | 9 | 10 | @H_551_403@ @H_794_404@
---|---|---|---|---|
a18 | 1 | 0 | X | 2 | @H_551_403@
算法过程:
- 根据身份证主体码(前17位)分别与对应的加权因子(表1)计算乘积再求和,根据所得结果与11取模得到X值。
- 根据 X 值查询表2,得出a18即校验码值。
校验码计算程序及测试见如下代码:
var checkCode = /^[1-9]\d{5}(18|19|20)\d{2}((0[1-9])|(1[0-2]))(([0-2][1-9])|10|20|30|31)\d{3}[0-9Xx]$/;
var factor = [ 7,0);font-weight:bolder;">9,0);font-weight:bolder;">10,0);font-weight:bolder;">5,0);font-weight:bolder;">8,0);font-weight:bolder;">2,0);font-weight:bolder;">1,0);font-weight:bolder;">3,0);font-weight:bolder;">2 ];
var parity = [ 'X',0);">var code = val.substring(17);
if(p.test(val)) {
var sum = 0;
for(var i=0;i<17;i++) {
sum += val[i]*factor[i];
}
if(parity[sum % 11] == code.toUpperCase()) {
// 输出 true, 校验码相符
console.log(checkCode(// 输出 false, 校验码不符
"110105194912310021"));
2.4 方案2整体代码
var checkID = if(checkCode(val)) {
14);
if(checkDate(date)) {
if(checkProv(val.substring(2))) {
true;
}
}
}
console.log(checkID(//输出 false,校验码不符
"110105194912310021"));
//输出 false,日期码不符
"110105194902310026"));
//输出 false,地区码不符
"160105194912310029"));