欢迎访问悦橙教程(wld5.com),关注java教程。悦橙教程  java问答|  每日更新
页面导航 : > > 文章正文

JAVA 中文转拼音,,import java.

来源: javaer 分享于  点击 10021 次 点评:115

JAVA 中文转拼音,,import java.


import java.io.UnsupportedEncodingException;import java.util.Iterator;import java.util.LinkedHashMap;import java.util.Set;import org.apache.log4j.Logger;/** * 将中文转化为拼音 * * @author admin * */public class Cn2Spell {    private static Logger log = Logger.getLogger("UtilLog");    private static LinkedHashMap<String, Integer> spellMap = null;    private static LinkedHashMap<String, Integer> otherSpellMap = null;    private Cn2Spell() {    }    static {        if (spellMap == null) {            spellMap = new LinkedHashMap<String, Integer>(400);        }        if (otherSpellMap == null) {            otherSpellMap = new LinkedHashMap<String, Integer>(100);        }        initialize();        log.info("Chinese transfer Spell Done.");    }    private static void spellPut(String spell, int ascii) {        spellMap.put(spell, new Integer(ascii));    }    private static void otherSpellPut(String spell, int ascii) {        otherSpellMap.put(spell, new Integer(ascii));    }    private static void initialize() {        spellPut("a", -20319);        spellPut("ai", -20317);        spellPut("an", -20304);        spellPut("ang", -20295);        spellPut("ao", -20292);        spellPut("ba", -20283);        spellPut("bai", -20265);        spellPut("ban", -20257);        spellPut("bang", -20242);        spellPut("bao", -20230);        spellPut("bei", -20051);        spellPut("ben", -20036);        spellPut("beng", -20032);        spellPut("bi", -20026);        spellPut("bian", -20002);        spellPut("biao", -19990);        spellPut("bie", -19986);        spellPut("bin", -19982);        spellPut("bing", -19976);        spellPut("bo", -19805);        spellPut("bu", -19784);        spellPut("ca", -19775);        spellPut("cai", -19774);        spellPut("can", -19763);        spellPut("cang", -19756);        spellPut("cao", -19751);        spellPut("ce", -19746);        spellPut("ceng", -19741);        spellPut("cha", -19739);        spellPut("chai", -19728);        spellPut("chan", -19725);        spellPut("chang", -19715);        spellPut("chao", -19540);        spellPut("che", -19531);        spellPut("chen", -19525);        spellPut("cheng", -19515);        spellPut("chi", -19500);        spellPut("chong", -19484);        spellPut("chou", -19479);        spellPut("chu", -19467);        spellPut("chuai", -19289);        spellPut("chuan", -19288);        spellPut("chuang", -19281);        spellPut("chui", -19275);        spellPut("chun", -19270);        spellPut("chuo", -19263);        spellPut("ci", -19261);        spellPut("cong", -19249);        spellPut("cou", -19243);        spellPut("cu", -19242);        spellPut("cuan", -19238);        spellPut("cui", -19235);        spellPut("cun", -19227);        spellPut("cuo", -19224);        spellPut("da", -19218);        spellPut("dai", -19212);        spellPut("dan", -19038);        spellPut("dang", -19023);        spellPut("dao", -19018);        spellPut("de", -19006);        spellPut("deng", -19003);        spellPut("di", -18996);        spellPut("dian", -18977);        spellPut("diao", -18961);        spellPut("die", -18952);        spellPut("ding", -18783);        spellPut("diu", -18774);        spellPut("dong", -18773);        spellPut("dou", -18763);        spellPut("du", -18756);        spellPut("duan", -18741);        spellPut("dui", -18735);        spellPut("dun", -18731);        spellPut("duo", -18722);        spellPut("e", -18710);        spellPut("en", -18697);        spellPut("er", -18696);        spellPut("fa", -18526);        spellPut("fan", -18518);        spellPut("fang", -18501);        spellPut("fei", -18490);        spellPut("fen", -18478);        spellPut("feng", -18463);        spellPut("fo", -18448);        spellPut("fou", -18447);        spellPut("fu", -18446);        spellPut("ga", -18239);        spellPut("gai", -18237);        spellPut("gan", -18231);        spellPut("gang", -18220);        spellPut("gao", -18211);        spellPut("ge", -18201);        spellPut("gei", -18184);        spellPut("gen", -18183);        spellPut("geng", -18181);        spellPut("gong", -18012);        spellPut("gou", -17997);        spellPut("gu", -17988);        spellPut("gua", -17970);        spellPut("guai", -17964);        spellPut("guan", -17961);        spellPut("guang", -17950);        spellPut("gui", -17947);        spellPut("gun", -17931);        spellPut("guo", -17928);        spellPut("ha", -17922);        spellPut("hai", -17759);        spellPut("han", -17752);        spellPut("hang", -17733);        spellPut("hao", -17730);        spellPut("he", -17721);        spellPut("hei", -17703);        spellPut("hen", -17701);        spellPut("heng", -17697);        spellPut("hong", -17692);        spellPut("hou", -17683);        spellPut("hu", -17676);        spellPut("hua", -17496);        spellPut("huai", -17487);        spellPut("huan", -17482);        spellPut("huang", -17468);        spellPut("hui", -17454);        spellPut("hun", -17433);        spellPut("huo", -17427);        spellPut("ji", -17417);        spellPut("jia", -17202);        spellPut("jian", -17185);        spellPut("jiang", -16983);        spellPut("jiao", -16970);        spellPut("jie", -16942);        spellPut("jin", -16915);        spellPut("jing", -16733);        spellPut("jiong", -16708);        spellPut("jiu", -16706);        spellPut("ju", -16689);        spellPut("juan", -16664);        spellPut("jue", -16657);        spellPut("jun", -16647);        spellPut("ka", -16474);        spellPut("kai", -16470);        spellPut("kan", -16465);        spellPut("kang", -16459);        spellPut("kao", -16452);        spellPut("ke", -16448);        spellPut("ken", -16433);        spellPut("keng", -16429);        spellPut("kong", -16427);        spellPut("kou", -16423);        spellPut("ku", -16419);        spellPut("kua", -16412);        spellPut("kuai", -16407);        spellPut("kuan", -16403);        spellPut("kuang", -16401);        spellPut("kui", -16393);        spellPut("kun", -16220);        spellPut("kuo", -16216);        spellPut("la", -16212);        spellPut("lai", -16205);        spellPut("lan", -16202);        spellPut("lang", -16187);        spellPut("lao", -16180);        spellPut("le", -16171);        spellPut("lei", -16169);        spellPut("leng", -16158);        spellPut("li", -16155);        spellPut("lia", -15959);        spellPut("lian", -15958);        spellPut("liang", -15944);        spellPut("liao", -15933);        spellPut("lie", -15920);        spellPut("lin", -15915);        spellPut("ling", -15903);        spellPut("liu", -15889);        spellPut("long", -15878);        spellPut("lou", -15707);        spellPut("lu", -15701);        spellPut("lv", -15681);        spellPut("luan", -15667);        spellPut("lue", -15661);        spellPut("lun", -15659);        spellPut("luo", -15652);        spellPut("ma", -15640);        spellPut("mai", -15631);        spellPut("man", -15625);        spellPut("mang", -15454);        spellPut("mao", -15448);        spellPut("me", -15436);        spellPut("mei", -15435);        spellPut("men", -15419);        spellPut("meng", -15416);        spellPut("mi", -15408);        spellPut("mian", -15394);        spellPut("miao", -15385);        spellPut("mie", -15377);        spellPut("min", -15375);        spellPut("ming", -15369);        spellPut("miu", -15363);        spellPut("mo", -15362);        spellPut("mou", -15183);        spellPut("mu", -15180);        spellPut("na", -15165);        spellPut("nai", -15158);        spellPut("nan", -15153);        spellPut("nang", -15150);        spellPut("nao", -15149);        spellPut("ne", -15144);        spellPut("nei", -15143);        spellPut("nen", -15141);        spellPut("neng", -15140);        spellPut("ni", -15139);        spellPut("nian", -15128);        spellPut("niang", -15121);        spellPut("niao", -15119);        spellPut("nie", -15117);        spellPut("nin", -15110);        spellPut("ning", -15109);        spellPut("niu", -14941);        spellPut("nong", -14937);        spellPut("nu", -14933);        spellPut("nv", -14930);        spellPut("nuan", -14929);        spellPut("nue", -14928);        spellPut("nuo", -14926);        spellPut("o", -14922);        spellPut("ou", -14921);        spellPut("pa", -14914);        spellPut("pai", -14908);        spellPut("pan", -14902);        spellPut("pang", -14894);        spellPut("pao", -14889);        spellPut("pei", -14882);        spellPut("pen", -14873);        spellPut("peng", -14871);        spellPut("pi", -14857);        spellPut("pian", -14678);        spellPut("piao", -14674);        spellPut("pie", -14670);        spellPut("pin", -14668);        spellPut("ping", -14663);        spellPut("po", -14654);        spellPut("pu", -14645);        spellPut("qi", -14630);        spellPut("qia", -14594);        spellPut("qian", -14429);        spellPut("qiang", -14407);        spellPut("qiao", -14399);        spellPut("qie", -14384);        spellPut("qin", -14379);        spellPut("qing", -14368);        spellPut("qiong", -14355);        spellPut("qiu", -14353);        spellPut("qu", -14345);        spellPut("quan", -14170);        spellPut("que", -14159);        spellPut("qun", -14151);        spellPut("ran", -14149);        spellPut("rang", -14145);        spellPut("rao", -14140);        spellPut("re", -14137);        spellPut("ren", -14135);        spellPut("reng", -14125);        spellPut("ri", -14123);        spellPut("rong", -14122);        spellPut("rou", -14112);        spellPut("ru", -14109);        spellPut("ruan", -14099);        spellPut("rui", -14097);        spellPut("run", -14094);        spellPut("ruo", -14092);        spellPut("sa", -14090);        spellPut("sai", -14087);        spellPut("san", -14083);        spellPut("sang", -13917);        spellPut("sao", -13914);        spellPut("se", -13910);        spellPut("sen", -13907);        spellPut("seng", -13906);        spellPut("sha", -13905);        spellPut("shai", -13896);        spellPut("shan", -13894);        spellPut("shang", -13878);        spellPut("shao", -13870);        spellPut("she", -13859);        spellPut("shen", -13847);        spellPut("sheng", -13831);        spellPut("shi", -13658);        spellPut("shou", -13611);        spellPut("shu", -13601);        spellPut("shua", -13406);        spellPut("shuai", -13404);        spellPut("shuan", -13400);        spellPut("shuang", -13398);        spellPut("shui", -13395);        spellPut("shun", -13391);        spellPut("shuo", -13387);        spellPut("si", -13383);        spellPut("song", -13367);        spellPut("sou", -13359);        spellPut("su", -13356);        spellPut("suan", -13343);        spellPut("sui", -13340);        spellPut("sun", -13329);        spellPut("suo", -13326);        spellPut("ta", -13318);        spellPut("tai", -13147);        spellPut("tan", -13138);        spellPut("tang", -13120);        spellPut("tao", -13107);        spellPut("te", -13096);        spellPut("teng", -13095);        spellPut("ti", -13091);        spellPut("tian", -13076);        spellPut("tiao", -13068);        spellPut("tie", -13063);        spellPut("ting", -13060);        spellPut("tong", -12888);        spellPut("tou", -12875);        spellPut("tu", -12871);        spellPut("tuan", -12860);        spellPut("tui", -12858);        spellPut("tun", -12852);        spellPut("tuo", -12849);        spellPut("wa", -12838);        spellPut("wai", -12831);        spellPut("wan", -12829);        spellPut("wang", -12812);        spellPut("wei", -12802);        spellPut("wen", -12607);        spellPut("weng", -12597);        spellPut("wo", -12594);        spellPut("wu", -12585);        spellPut("xi", -12556);        spellPut("xia", -12359);        spellPut("xian", -12346);        spellPut("xiang", -12320);        spellPut("xiao", -12300);        spellPut("xie", -12120);        spellPut("xin", -12099);        spellPut("xing", -12089);        spellPut("xiong", -12074);        spellPut("xiu", -12067);        spellPut("xu", -12058);        spellPut("xuan", -12039);        spellPut("xue", -11867);        spellPut("xun", -11861);        spellPut("ya", -11847);        spellPut("yan", -11831);        spellPut("yang", -11798);        spellPut("yao", -11781);        spellPut("ye", -11604);        spellPut("yi", -11589);        spellPut("yin", -11536);        spellPut("ying", -11358);        spellPut("yo", -11340);        spellPut("yong", -11339);        spellPut("you", -11324);        spellPut("yu", -11303);        spellPut("yuan", -11097);        spellPut("yue", -11077);        spellPut("yun", -11067);        spellPut("za", -11055);        spellPut("zai", -11052);        spellPut("zan", -11045);        spellPut("zang", -11041);        spellPut("zao", -11038);        spellPut("ze", -11024);        spellPut("zei", -11020);        spellPut("zen", -11019);        spellPut("zeng", -11018);        spellPut("zha", -11014);        spellPut("zhai", -10838);        spellPut("zhan", -10832);        spellPut("zhang", -10815);        spellPut("zhao", -10800);        spellPut("zhe", -10790);        spellPut("zhen", -10780);        spellPut("zheng", -10764);        spellPut("zhi", -10587);        spellPut("zhong", -10544);        spellPut("zhou", -10533);        spellPut("zhu", -10519);        spellPut("zhua", -10331);        spellPut("zhuai", -10329);        spellPut("zhuan", -10328);        spellPut("zhuang", -10322);        spellPut("zhui", -10315);        spellPut("zhun", -10309);        spellPut("zhuo", -10307);        spellPut("zi", -10296);        spellPut("zong", -10281);        spellPut("zou", -10274);        spellPut("zu", -10270);        spellPut("zuan", -10262);        spellPut("zui", -10260);        spellPut("zun", -10256);        spellPut("zuo", -10254);        otherSpellPut("a-1", -7996);        otherSpellPut("a-2", -4167);        otherSpellPut("a-3", -31359);        otherSpellPut("ai-1", -5054);        otherSpellPut("bo-1", -8029);        otherSpellPut("rui-1", -4445);        otherSpellPut("yan-1", -5145);    }    /**     * 获得单个汉字的Ascii.     *     * @param cn     *            - char 汉字字符     * @return int 错误返回 0,否则返回ascii     */    public static int getCnAscii(char cn) {        byte[] bytes = null;        try {            bytes = (String.valueOf(cn)).getBytes("GBK");        } catch (UnsupportedEncodingException ex) {        }        if (bytes == null || bytes.length > 2 || bytes.length <= 0) { // 错误            log.info("转换时发生错误!!");            return 0;        }        if (bytes.length == 1) { // 英文字符            log.info("/"" + cn + "/"是英文字符,其 ASCII 为:" + bytes[0]);            return bytes[0];        }        if (bytes.length == 2) { // 中文字符            int hightByte = 256 + bytes[0];            int lowByte = 256 + bytes[1];            int ascii = (256 * hightByte + lowByte) - 256 * 256;            log.info("/"" + cn + "/"的 ASCII 为 :  " + ascii);            return ascii;        }        log.info("转换时发生错误!!");        return 0; // 错误    }    /**     * 根据ASCII码到SpellMap中查找对应的拼音     *     * @param ascii     *            - int 字符对应的ASCII     * @return String 拼音,首先判断ASCII是否>0&amp;<160, 如果是返回对应的字符,否则到SpellMap中查找,     *         如果没有找到拼音,则返回null, 如果找到则返回拼音.     */    public static String getSpellByAscii(int ascii) {        if (ascii > 0 &amp;&amp; ascii < 160) { // 单字符            return String.valueOf((char) ascii);        }        if (ascii < -20319 || ascii > -10247) { // 其他的字符            Iterator<String> oit = otherSpellMap.keySet().iterator();            while (oit.hasNext()) {                String otherSpell = (String) oit.next();                Object otherValObj = otherSpellMap.get(otherSpell);                if (otherValObj instanceof Integer) {                    if (ascii == ((Integer) otherValObj).intValue()) {                        log.info("此时的拼音为:" + otherSpell);                        return otherSpell.split("-")[0];                    }                }            }            log.info("无法识别,可手动添加。/n在添加之前强行将此字符拼音定义为z");            return "z";        }        Set<String> keySet = spellMap.keySet();        Iterator<String> it = keySet.iterator();        String spell0 = null;        String spell = null;        int asciiRang0 = -20319;        int asciiRang;        while (it.hasNext()) {            spell = (String) it.next();            Object valObj = spellMap.get(spell);            if (valObj instanceof Integer) {                asciiRang = ((Integer) valObj).intValue();                if (ascii >= asciiRang0 &amp;&amp; ascii < asciiRang) { // 区间找到                    log.info("此时的拼音为:" + spell + "/n其对应的区间起始数字为:" + asciiRang0                            + "/n上一个拼音为:" + spell0 + "/n即字符对应拼音应为:" + spell0);                    return (spell0 == null) ? spell : spell0;                } else {                    spell0 = spell;                    asciiRang0 = asciiRang;                    // log.info("此时的拼音为:" + spell + "/n其对应的区间起始数字为:" +                    // asciiRang0);                }            }        }        return null;    }    /**     * 判断是否是字母     *     * @param ascii     *            - int 字符对应的ASCII     * @return boolean 返回是否是字母的结果     */    @SuppressWarnings("unused")    private static boolean isAlphabet(int ascii) {        if (ascii > 0 &amp;&amp; ascii < 160) {            return true;        } else {            return false;        }    }    /**     * 返回字符串的全拼,是汉字转化为全拼,其它字符不进行转换     *     * @param cnStr     *            - String 字符串     * @return String 转换成全拼后的字符串     */    public static String getFullSpell(String cnStr) {        if (null == cnStr || "".equals(cnStr.trim())) {            return cnStr;        }        // boolean isChinese = false;        char[] chars = cnStr.toCharArray();        StringBuffer retuBuf = new StringBuffer();        StringBuffer resultBuf = new StringBuffer();        for (int i = 0, Len = chars.length; i < Len; i++) {            int ascii = getCnAscii(chars[i]);            if (ascii == 0) { // 取ascii时出错                retuBuf.append(chars[i]);            } else {                String spell = getSpellByAscii(ascii);                if (spell == null) {                    retuBuf.append(chars[i]);                } else {                    log.info(chars[i] + "的拼音为:" + spell);                    retuBuf.append(spell);                }                // if (!isAlphabet(ascii)) {                // isChinese = true;                // // retuBuf.append(" ");                // }            } // end of if ascii <= -20400        }        // if (isChinese) {        // // resultBuf.append(cnStr);        // // resultBuf.append("");        // resultBuf.append(retuBuf.toString());        // } else {        // resultBuf.append(retuBuf.toString());        // }        resultBuf.append(retuBuf.toString());        return resultBuf.toString();    }    public static String getFirstSpell(String cnStr) {        return null;    }    public static void main(String[] args) {        String str = null;        try {            str = new String("你好呀".getBytes(), "UTF-8");        } catch (UnsupportedEncodingException ex) {        }        System.out.println("/"" + str + "/"的拼音为:" + Cn2Spell.getFullSpell(str));    }}
相关栏目:

用户点评