hit counter for blogger

黑暗執行緒

 黑暗執行緒搬新家囉!! http://www.darkthread.net

6/30/2006

Word HTML精簡化工具


多年來,我的KB、備忘錄等等多半是用Outlook編輯及歸檔,一來是背後串接了Mail/公用資料夾可以快速地與人溝通及分享,二來Outlook結合了Word作為文字編輯器,文字格式彈性、排版功能不在話下,又不用花時間學習。前陣子小熊子介紹我裝了Google Desktop,更是讓原本龜爬的查詢功能一飛沖天! 以前為了怕PST太大易出問題,我都會每半年分出一個PST檔。偏偏Outlook每次查詢時只能限一個PST檔,如果年代不確定時,就得半年半年的找(不過應該還是比總統府找發票快一點點,呵!),甚為煩人。現在只要在Outlook的Google Desktop快速列輸入關鍵字,不消2秒,搜索的範圍就跨越了我從菜鳥工程師到技術老油條的近十年歲月! 這下子,更可確定Outlook將會是我唯一的知識文件管理平台!!
不過有些時候,Mail的內容要轉成網頁貼在討論區或Blog,Word的RichText雖然可以直接轉成HTML,但是如果你懂HTML,檢視一下他的HTML原始碼,包你吐血!!
例如: 簡簡單單一句VS.NET Debug,Word竟囉嗦到中英文各用SPAN包夾,並且每個SPAN都要加上幾乎100%相同的STYLE設定,再額外插入一堆mso-開頭Word專用的STYLE參數,於是就變成了這副德性:
<span style='font-size:9.0pt;mso-bidi-font-size:10.0pt;font-family:新細明體;mso-ascii-font-family:Arial;mso-hansi-font-family:Arial;mso-bidi-font-family:Arial'></span></font><font size=1 face=Arial><span lang=EN-US style='font-size:9.0pt;mso-bidi-font-size:10.0pt;font-family:Arial'>VS.NET Debug</span></font><font size=1 face=新細明體><span style='font-size:9.0pt;mso-bidi-font-size:10.0pt;font-family:新細明體;mso-ascii-font-family:Arial;mso-hansi-font-family:Arial;mso-bidi-font-family:Arial'>
本來十幾個Bytes可以搞定的事,它硬是用快500 Bytes,長舌得很… 對頻寬很在意的我,不太能忍受這個結果,但要我將Outlook已經打好的東西還要再用FrontPage或UltraEdit重新編一次,太不甘心。於是我寫了個一個Word HTML淨化器,可以將Word囉嗦的作文去蕪存菁,在不破壞原有格式的前題下,減少HTML的資料量。
如下圖,原本20K的大小立刻縮小到1/5不到,只剩3.7K,而且格式仍保持不變!

程式可以按這裡下載。有興趣的人拿去用,記得要先裝.NET 2.0。試用的人順便幫我Debug,有問題再回報給我囉!

2 Comments:

  • 哈,你終於決定落腳 blogger 了!來跟你祝賀喬遷之喜的!

    By Anonymous lucas, at 6/30/2006 10:42 am  

  • 之前被PCHome的個人新聞台的穩定性氣到腦衝血,決定投靠有Google撐腰的Blogger,而Blogger雖有照片上傳的功能,但沒有管理介面讓人倒彈,所以圖片就交給有Yahoo撐腰的Flickr。
    穩定上是肯定沒問題了,只是Blogger以部落格的標準來說,功能簡陋了點,沒分類、沒有小日曆索引,也沒有最新留言的彙總。雖然有不少自力救濟的方案,不過要等我的懶病痊瘉之後再說吧!

    By Blogger Darkthread, at 6/30/2006 12:49 pm  

Post a Comment

<< Home