如何在java中为UTF8字符串做子串?

前端之家收集整理的这篇文章主要介绍了如何在java中为UTF8字符串做子串?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
假设我有以下字符串:RückrufinsAusland我需要将其插入到最大大小为10的数据库中.
我在 java中做了一个普通的子串,它提取了这个字符串Rückruf,其中有10个字符.当它试图插入此列时,我得到以下oracle错误

java.sql.sqlException: ORA-12899: value too large for column
“WAEL”.”TESTTBL”.”DESC” (actual: 11,maximum: 10)
The reason for this is that the database has a AL32UTF8 character set thus the ü will take 2 chars.

我需要在java中编写一个执行此子字符串的函数,但考虑到ü需要2个字节,因此在这种情况下返回的子字符串应该是Rückrufi(9个字符).有什么建议?

解决方法

如果你想在 Java中修剪数据,你必须编写一个函数,使用所使用的db charset修剪字符串,类似于这个测试用例:
package test;

import java.io.UnsupportedEncodingException;

public class TrimField {

    public static void main(String[] args) {
        //UTF-8 is the db charset
        System.out.println(trim("Rückruf ins Ausland",10,"UTF-8"));
        System.out.println(trim("Rüückruf ins Ausland","UTF-8"));
    }

    public static String trim(String value,int numBytes,String charset) {
        do {
            byte[] valueInBytes = null;
            try {
                valueInBytes = value.getBytes(charset);
            } catch (UnsupportedEncodingException e) {
                throw new RuntimeException(e.getMessage(),e);
            }
            if (valueInBytes.length > numBytes) {
                value = value.substring(0,value.length() - 1);
            } else {
                return value;
            }
        } while (value.length() > 0);
        return "";

    }

}

猜你在找的Java相关文章