java中unicode和中文相互转换的简单实现

前端技术 2023/09/03 Java

如下所示：

package test.com.gjob.services;
  import java.util.Properties;
   public class Test { 
      public static void main(String[] args) { 
      String s = \"简介\"; 
      String tt = gbEncoding(s); 
  //    String tt1 = \"你好，我想给你说一个事情\";
      System.out.println(decodeUnicode(\"\\\\u7b80\\\\u4ecb\")); 
  //    System.out.println(decodeUnicode(tt1)); 
      System.out.println(HTMLDecoder.decode(\"中国\"));
      String s1 = \"\\u7b80\\u4ecb\";
      System.out.println(s.indexOf(\"\\\\\"));
     } 
     public static String gbEncoding(final String gbString) { 
     char[] utfBytes = gbString.toCharArray(); 
        String unicodeBytes = \"\"; 
        for (int byteIndex = 0; byteIndex < utfBytes.length; byteIndex++) { 
           String hexB = Integer.toHexString(utfBytes[byteIndex]); 
            if (hexB.length() <= 2) { 
              hexB = \"00\" + hexB; 
           } 
            unicodeBytes = unicodeBytes + \"\\\\u\" + hexB; 
          } 
          System.out.println(\"unicodeBytes is: \" + unicodeBytes); 
          return unicodeBytes; 
       } 
      
       public static String decodeUnicode(final String dataStr) { 
        int start = 0; 
         int end = 0; 
         final StringBuffer buffer = new StringBuffer(); 
         while (start > -1) { 
           end = dataStr.indexOf(\"\\\\u\", start + 2); 
           String charStr = \"\"; 
           if (end == -1) { 
             charStr = dataStr.substring(start + 2, dataStr.length()); 
           } else { 
             charStr = dataStr.substring(start + 2, end); 
           } 
           char letter = (char) Integer.parseInt(charStr, 16); // 16进制parse整形字符串。 
          buffer.append(new Character(letter).toString()); 
          start = end; 
         } 
         return buffer.toString(); 
       } 
     }

public static String decodeUnicode(String theString) {  
 
   char aChar;  
 
   int len = theString.length();  
 
   StringBuffer outBuffer = new StringBuffer(len);  
 
   for (int x = 0; x < len;) {  
 
   aChar = theString.charAt(x++);  
 
   if (aChar == \'\\\\\') {  
 
    aChar = theString.charAt(x++);  
 
    if (aChar == \'u\') {  
 
    // Read the xxxx  
 
    int value = 0;  
 
    for (int i = 0; i < 4; i++) {  
 
     aChar = theString.charAt(x++);  
 
     switch (aChar) {  
 
     case \'0\':  
 
     case \'1\':  
 
     case \'2\':  
 
     case \'3\':  
 
    case \'4\':  
 
     case \'5\':  
 
     case \'6\':  
      case \'7\':  
      case \'8\':  
      case \'9\':  
      value = (value << 4) + aChar - \'0\';  
      break;  
      case \'a\':  
      case \'b\':  
      case \'c\':  
      case \'d\':  
      case \'e\':  
      case \'f\':  
      value = (value << 4) + 10 + aChar - \'a\';  
      break;  
      case \'A\':  
      case \'B\':  
      case \'C\':  
      case \'D\':  
      case \'E\':  
      case \'F\':  
      value = (value << 4) + 10 + aChar - \'A\';  
      break;  
      default:  
      throw new IllegalArgumentException(  
       \"Malformed  \\\\uxxxx  encoding.\");  
      }  
 
     }  
     outBuffer.append((char) value);  
     } else {  
     if (aChar == \'t\')  
      aChar = \'\\t\';  
     else if (aChar == \'r\')  
      aChar = \'\\r\';  
 
     else if (aChar == \'n\')  
 
      aChar = \'\\n\';  
 
     else if (aChar == \'f\')  
 
      aChar = \'\\f\';  
 
     outBuffer.append(aChar);  
 
     }  
 
    } else  
 
    outBuffer.append(aChar);  
 
    }  
 
    return outBuffer.toString();  
 
   }

以上这篇java中unicode和中文相互转换的简单实现就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持phpstudy。

本文地址：https://www.stayed.cn/item/8498

转载请注明出处。

本站部分内容来源于网络,如侵犯到您的权益,请联系我

微信
QQ好友
QQ空间
腾讯微博
新浪微博
人人网

我的博客

人生若只如初见，何事秋风悲画扇。

我的标签

随笔档案

2024-02(2)
2023-06(1)
2023-05(1)
2023-04(14)
2023-03(3)
2023-01(6)
2022-12(5)
2022-11(5)
2022-07(2)
2022-06(4)
2022-05(3)
2022-03(1)
2021-12(6)
2021-11(1)
2021-10(3)
2021-09(5)
2021-07(5)
2021-02(2)
2021-01(7)
2020-12(18)
2020-11(14)
2020-10(12)
2020-09(10)
2020-08(22)
2020-07(2)
2020-06(1)
2020-04(5)
2020-03(9)
2020-02(7)
2020-01(9)
2019-12(8)
2019-11(10)
2019-10(11)
2019-09(17)
2019-08(16)
2019-07(6)
2019-06(3)
2019-04(1)
2019-03(8)
2019-02(5)
2019-01(1)
2018-11(2)
2018-10(3)
2018-09(1)
2018-08(3)
2018-07(3)
2018-06(7)
2018-04(4)
2018-03(5)
2018-02(4)
2018-01(22)
2017-12(3)
2017-11(5)
2017-10(15)
2017-09(26)
2017-08(1)
2017-07(3)