在現在這樣一個全球化環境中
因為在不同的語言中有很多不同的語法規則
所以以前很多簡單的任務現在都變得很困難
你可以將一門特定的語言分成一組語法規則和針對這些規則的異常(以及一個基本詞語)
從而將這些任務一般化
在一些編程語言(比如 Perl 和 Java)中
有一些公共域(domain)模塊可以用來對文本完成語言轉換
下面給出一個稍微簡單一點兒的例子
假設我們要將一個數字轉換成其拼寫版本(例如需要填寫支票和法律合同)
這個訣竅在 Oracle 出現的早期已經有了
一般都以如下方式使用
selectto_char(to_date(
J
)
Jsp
) from dual
Twelve Thousand Three Hundred Forty
Five
TO_DATE 函數使用 Julian 日期格式將數字轉換成一個日期
然後
TO_CHAR 接受一個日期參數並再次將其格式化為一個表示 Julian 日期的拼寫數字版本的字符串
但是這個決竅有一些限制
首先
在 Oracle 中 Julian 日期的最大有效值是
年
所以日期的最大值只能取到
而最小值是
或
BC
而且
因為沒有第
零
年
所以如果不額外使用一個 DECODE 或 CASE 語句就不可能生成文本
零
第三個大的限制是它會忽略掉你的 NLS 設置
不管你使用的是哪種語言
數字總是以美國英語拼寫出
一些簡單的操作也存在這樣的問題
比如拼寫出天
例如
嘗試生成西班牙語短語
Cinco de Mayo
alter session set nls_language =
SPANISH
select to_char(to_date(
MMDD
)
Ddspth Month
) from dual
Fifth Mayo 在為大多數語言生成數字時涉及的語法實際上相當簡單
主體工作包括收集所有不同的語法規則並建立起足夠的規則來生成正確的語法模式
(現在我將回避涉及到匹配數字和性別的問題
)
首先
我將創建兩個表
第一個表保存基本的單詞和異常
第二個表保存用於生成文本的一些簡單的模板模式
如果在第一個表中有數字
那麼我的語言函數就返回那個文本
對於其它每個數字
我將試圖在一系列模式中匹配它
並應用一個模板來生成正確的文本
create table numwords(lang varchar
(
)
num integer
word varchar
(
)
constraint numwords_pk primary key (lang
num))
create table numrules(lang varchar
(
)
seq integer
p
integer
p
integer
temp
varchar
(
)
temp varchar
(
)
constraint numrules_pk primary key (lang
seq))
From:http://tw.wingwit.com/Article/program/SQLServer/201311/22236.html