將word文檔轉換後有一個方形的全黑的符號
只有自己寫一個filter才能過濾掉
把轉換後的文檔裡面非中文的字符串過濾掉這個黑框即可
如何過濾? 根據byte值過濾就行了
看byte值是否相等
注意
一定要先判斷這個字符串是不是中文字符
是中文就不要進行過濾
否則
就會得出錯誤的結果
如何判斷是不是中文字符? 根據該string第一個字節的byte值的范圍
但是有兩點要注意
因為可能是中英文混和
所以才要判斷
你可以把一個String分成String
length()個string來看待
然後每個string判斷它第一個字節值是多少
黑框的byte值
你copy過去
然後new一個string
print出他的bytevalue就可以得到了
From:http://tw.wingwit.com/Article/program/Java/Javascript/201311/25325.html