2013年3月5日 星期二

PHP繁簡轉換

※如果要轉換的繁體和簡體,編碼都是UTF8,可以使用 mediawiki-zhconverter
  1. mediawiki-zhconverter 是使用 MediaWiki 的繁簡轉換功能,再配合 mediawiki-zhconverter.inc.php 來進行轉換,所以需要下載 MediaWiki 套件和 mediawiki-zhconverter.inc.php 檔案。(MediaWiki 對於語法用字的差異亦能轉換)
  2. http://code.google.com/p/mediawiki-zhconverter/ 查看 "支援版本" 說明,查看mediawiki-zhconverter可正常運作的MediaWiki版本。
    如下:如果使用PHP5則可使用1.12.0、1.13.3、1.15.4 任選一版本下載
    PHP4: 1.6.10, 1.6.11
    PHP5: 1.12.0, 1.13.3, 1.15.4
  3. http://dumps.wikimedia.org/mediawiki/ 下載前一步驟選的MediaWiki版本。
  4. http://code.google.com/p/mediawiki-zhconverter/downloads/list 下載 mediawiki-zhconverter.inc.php 壓縮檔。
  5. 將 MediaWiki 和 mediawiki-zhconverter.inc.php 都解壓縮。
  6. 範例:
    define("MEDIAWIKI_PATH", dirname(__FILE__) .  "/mediawiki-1.15.4/");//定義MediaWiki路徑為MEDIAWIKI_PATH常數
    require_once "mediawiki-zhconverter.inc.php";
    echo MediaWikiZhConverter::convert("面包", "zh-tw");//轉台灣繁體
    echo MediaWikiZhConverter::convert("記憶體", "zh-cn");//轉大陸簡體
    echo MediaWikiZhConverter::convert("罗纳尔多", "zh-hk");//轉香港繁體

※如果要轉換的繁體編碼是BIG5,簡體編碼為GB2312,可以使用 yii-chinese
  1. http://code.google.com/p/yii-chinese/downloads/list 下載壓縮檔,解壓縮後,只需要裡面的 "config資料夾" 和 "JChinese.php檔案",config資料夾內放了繁簡轉換的對應資料。
  2. 範例:
    include("class.Chinese.php");
    $cfg_dir = './config/';//放繁簡轉換對應資料的資料夾
    $chs = new Chinese("BIG5","GB2312","記憶體",$cfg_dir);//BIG5 轉 GB2312
    echo $chs->ConvertIT();

3 則留言:

  1. 你好.採集數據後直接入資料庫的UTF8簡體.也可以變成繁體嗎?

    回覆刪除
    回覆
    1. 您好,資料庫是忠實記錄寫入的資料,
      所以要先自己轉喔。

      刪除
  2. 我寫了一個簡單的用WikiMedia字庫來繁簡轉換,有興趣可以看一下 https://github.com/steelywing/PHP-Chinese

    回覆刪除