公告版位

新版部落格:blog.changyy.org

目前分類:實作筆記 (341)

瀏覽方式: 標題列表 簡短摘要

Comma-separated values (CSV) 就是以逗號為欄位分隔,並以 line-based 的儲存格式,細節可參考 Wikipedia - Comma-separated values

在 Python 裡也有對應得 lib 可以用,只需 import csv 就行啦

changyy 發表在 痞客邦 留言(0) 人氣()

Hinedo Hinedo

Hinedo 是一套國人開發的免費廣播軟體,個人覺得十分夠用。然而在 Ubuntu 10.04 上安裝後,跑起來會有問題,其錯誤訊息:

changyy 發表在 痞客邦 留言(0) 人氣()

這陣子接觸圖書館服務,其中關於書目清單底層匯出的格式採用 MARC 格式,也是 ISO 2709 格式,相關資料如下:

花一點時間,總算看懂了。請看 Library of Congress >> MARC >> Authority >> LeaderMARC的結構 來對照,因為有時我竟然看不太懂中文!

changyy 發表在 痞客邦 留言(0) 人氣()

想要作 MapReduce 的工作,大概拿 Hadoop Streaming 試試,於是想要把資料弄成 line-based 模式,接著想到資料壓縮處理,然後就想測一下到底哪種比較合適

  • base64
  • json
  • bz2
  • gzip

雖然腦子裡大概有譜了,但還是測一下好了

changyy 發表在 痞客邦 留言(0) 人氣()

前陣子一直在調校 Javascript & Unzip 的事情,找到一個滿貼切工作的 -- Booktorious ,並且開始修改它。只是再怎樣地修改,在 Mobile Device 都不太適用,也被提醒會不會挑到的程式沒有實做很好,這部份我有留意它 unzip 的部份,的確存在不少可以精進的地方,當我準備要改得時候,我又看到了 rePublish 裡頭用的 zip 其實就已經接近我要改善的方式,因此筆記一下比較的過程,之後有空再慢慢增加其他對應的 library。

整個過程,看起來有點線性的成長,隨著檔案大小的增加,解壓縮的時間也會接近倍數成長。而 Booktorious 之 js-unzip 裡頭,有用到大量的資料複製,所以時間上花費會更多,相對於 rePublish 之 zip 的使用,對於 raw data 採用紀錄 offset 的方式,因此比 Booktorious 更加接近線性關係。

changyy 發表在 痞客邦 留言(0) 人氣()

週五下午接到主管的指令,要我把手上那台 iPad 給他 jailbreak 一下,小弟我當然就給他 try 一下。由於那台是 iOS 3.2.1 (最初是 iOS 3.2) ,所以就馬上試試 www.jailbreakme.com 這個網站的高招方式!它是利用 PDF 的漏洞(iOS 3.2.2 已修正),只要 iPad 透過 Safari 瀏覽器,就可以進行 jailbreak ,超方便的。

只是越獄後的 iPad ,還是少了主管要我做的相關資料,並且操作上有點怪怪的,主管就叫我重弄看看,我一時耍小聰明,直接用 General > Reset 的方式把資料清空,當下是因為沒有存 iPad iOS 3.2.1 ,直接用 iTunes 進行恢復大概也只能弄成 iOS 3.2.2 版,所以一時就想試看看 Reset 的方式,結果,試完重開機後,整個 iPad 就無法正常操作。

changyy 發表在 痞客邦 留言(0) 人氣()

遙想台灣 BBS 的興起,大概是 1997 前後,至少我是那時候開始接觸的?記得那時可還用著 33.6Kb 的數據機,後來又升級到 56 Kb ,當年好像是我姐說想要玩 BBS ,然後家裡就多牽了一條電話線,就這樣開啟玩網路的年代。除了 BBS 外,還有 ICQ 等聊天軟體,另外我則是跟隨同學的腳步,常常去"史萊姆的第一個家"找些新奇的軟體,當然,還有 MIDI 音樂等等的。但最後,還是跌入 BBS 裡頭,在那個青澀的年代裡。

前陣子想到撈一下 BBS 裡頭的資料,於是挑選了 Python 這個語言,它有 telnetlib 跟 expect 可以用,就等於解決撈 BBS 的最大困難之處。

changyy 發表在 痞客邦 留言(0) 人氣()

之前 把玩 Booktorious 時,碰到編碼的問題。苦思良久,今天發現,原來 Booktorious 的片段程式碼早就解決了!只是他只用在 XHTML 檔案而已。

整個流成是將一個 EPUB/ZIP 檔案,以 binary 型態讀進 Javascript 變數中,接著使用 js-unzip 和其相關套件,將變數所儲存的資料進行解壓縮,該 EPUB 檔案主要是一些 XHTML 或 XML 組成,緊接著分批處理那些 XHTML 跟 XML 檔案,在 Booktorious 已經很完善地解決完 XHTML 部份,然而,有些文件是 XML 部份則有編碼的問題。

changyy 發表在 痞客邦 留言(0) 人氣()

EPUB

Booktorious 是一套純 Javascript 的 EPUB reader,單純接收一個 *.epub 檔案,接著用 Javascript 進行 unzip ,接著再依照 EPUB 格式進行 parsing ,最終則把 EPUB 的內容用多個 iframe 依序成列出來。這是一套 open source 的 framework,這陣子花了一點時間把玩,此預設一次把 EPUB 全部 parsing 完,而我想更改成挑選章節的解壓縮方式。

changyy 發表在 痞客邦 留言(0) 人氣()

最近查看了以前的測試機器,發現原先用的 PHP 5.2.x 系列已經被更新成 5.3.x 系列,並且連執行個 php -v 會出現 Segmentation fault,上網隨意找到一些資訊,大概是 5.3.x 系列已經包括一些常用的 lib 進來,再次請教一下學弟,發現他已處理過這方面的問題,僅需在 php5-extension 去移除那些套件,另外則是 extensions.ini 須去除或註解一些套件,如此一來便可以處理完畢。雖然我修到 php -v 不會出現問題,但還是有些 lib 不能正常運行。甚至從編譯 php5-extension 仍會出錯,主要卡在 PCRE 的部分。

參考資料

changyy 發表在 痞客邦 留言(0) 人氣()

實在是有時網路速度很龜速,所以才想到用其他方式來下載檔案。用到的東西有三個:

  • Firefox + Firebug plugin
  • wget
  • 一個申請過 Apple ID 的帳密

首先先用該帳密登入到 iPhone Dev Center ( https://developer.apple.com/iphone/index.action#downloads ),並開啟 firebug 網路功能,準備偵測封包,接著就去點選下載新版的 iOS SDK,此例為 Xcode 3.2.3 and iOS SDK 4.0.1 ,之後就可以看到相關的網路封包,如 GET http://adcdownload.apple.com/ios/ios_sdk_4.0.1__final/xcode_3.2.3_and_ios_sdk_4.0.1.dmg ,查看其細部的 Cookie 資料,找尋 ADCDownloadAuth=...

changyy 發表在 痞客邦 留言(0) 人氣()

Mac OS X 有提供遠端桌面的服務,雖然可以設定密碼連線,但整個過程中似乎沒有加密?所以我就在 Ubuntu 上試著用 ssh tunnel 連到 Mac OS X。此目的是從 Ubuntu 機器遠端桌面到 Mac OS X 。

參考資料:

changyy 發表在 痞客邦 留言(0) 人氣()

距離上一次用 ipfw,大概已經是五六年前啦。主要是想要阻擋公司內部一些"彷彿中毒"電腦去 try 機器,另外,公司已經有強大的防火牆阻擋外部連進來,因此我只需限制公司內部的 IP 就行!此篇是最粗淺的設定筆記,並不適用其他常用的機器。除了 ipfw rules 外,其他的設定只是為了讓他可以開機就執行 ipfw 。

參考文件:

changyy 發表在 痞客邦 留言(0) 人氣()

之前用 PHP 寫了一些 tools level 的程式,也就是使用上都是透過 $ php t.php 的模式在進行,最近想替他加上 Signal 的處理,如此一來可以增加一些資料的正確性。

參考資料:

changyy 發表在 痞客邦 留言(0) 人氣()

目的:模擬連線到國外的網路品質。

由於有些新穎的服務都嘛是從國外開始蔓延,有的服務連過去使用時都有點頓頓,慶幸的有的是 Open Source,於是我把他架起來用用,但是,還是要好奇一下連到國外頓頓的感覺是不是完全是因為網路品質的關係,因此,我就要來試試將自己網路品質弄糟的方式。

changyy 發表在 痞客邦 留言(1) 人氣()

  1. 複製虛擬硬碟
    • $ VBoxManage clonevdi Source.vdi Target.vdi

changyy 發表在 痞客邦 留言(0) 人氣()

有時後會需要看別人寫的 Javascript Code,很多情況該程式碼已經被壓縮或最佳化,然後程式碼就被擠成一列而已,然而,那一些展開後可能是數百數千列的程式碼。

為此,就簡單寫隻 PHP 程式碼,把 Javascript Code 稍稍地排版,例如碰到 { 和 } 要縮排等,我記得以前用 Visual C++ 時,可全選程式碼後按 shtif + F8 就可以排版好了,這已經是七年前的印象,不過手邊沒這種環境,目前只愛用 vim 啦,就簡單寫一下 PHP 來處理。在自行更改 input 跟 output 吧。

changyy 發表在 痞客邦 留言(0) 人氣()

Bookworm 是一套採用 New BSD License 的 Open Source,細節請參考 http://code.google.com/p/threepress/ ,也可以直接使用線上版:

紀錄一下在從無到有的安裝過程:

changyy 發表在 痞客邦 留言(4) 人氣()

想說寫個簡單的 UITableViewController 來了解一些流程細節,結果每當我按下某個項目時,卻遲遲沒有動作?確認後,發現 didSelectRowAtIndexPath 函式完全沒進入。找了一些文章,也看不出個所以然,畢竟完完全全是最簡單的 UITableViewController ,新增後只修改 numberOfSectionsInTableView 和 numberOfRowsInSection 回傳的數字而已。

經過幾番確認,最後發現是我自己呼叫的流程問題:

changyy 發表在 痞客邦 留言(0) 人氣()

對 wget 這個 tool 不熟,平常使用 wget 下載一些資料時,可以輕易地使用 --referer 來偽造 HTTP Header 資料,因此能夠通過對方 Server 檢查

wget --referer="REFERER_URL" "TARGET_URL"

changyy 發表在 痞客邦 留言(0) 人氣()