Happy Web 2.0

這是給 Happy Web 2.0 的草稿區,
若是大家想知道甚麼也可以在這邊提出…

因為我們相信參與的人大部份都爬過Blog 與 wiki 了,
不然總要去不只是捷運日記看看吧..

所以主題是: 還未公開的部落格觀察

  • 部落格觀察是由幾隻程式完成的?

目前若不算實驗或預抓的程式的話, 放在Main Server端的有 121 隻程式.(2006/11/28)

  • 部落格觀察目前由幾台機器跑的?

在最多的時候是由 9~10 台跑的, 現在是由 5 台機器跑的..

  • 部落格的相關度是甚麼?

這個很單純的是去計算兩個部落格網址出現在同一個網頁的數目, 然後除以這兩個部落個的出現數, 這些數目都是從狐狗大神抓的, 所以抓的太兇的話大神會動怒, 所以以後會改成 On Demand.

  • 部落格觀察會不會 Open Source?

基本上我們完全不會考慮不開放程式 => 這意思就是一定會, 本來打算在 1.0 版就開始放在 Source Forage 的, 但似乎離 1.0 版還有段距離, 所以現在採 On Demand 的方式, 有誰要那段, 跟我們講, 我們就會放出來之類的方法, 不然要準備一份沒有密碼的, 還挺累的…

  • 一個還未公開的圖, 是前 1000 名的 BSP 分布圖:

BSP Distribute

  • 部落格觀察是不是個 SEO 工具?

我們也只敢在這邊偷偷說, 因為我們會存放完整的歷史記錄, 是許多 SEO 工具不會做的, 但我們不希望被冠上 SEO 工具的說法.

  • 第一次的發想

某動物在洗澡的時候, Eureka 出來的…

  • 第一次講到這計劃

We!Blog

  • 為了誰而作?

博客來 15%
聯絡家 20%
學學 25%
好玩 40%

  • 第一份Roadmap

隱藏在捷運日記的文後

  • 搬家史

開站~11/08 博客來
11/08~11/17 豬白/white那邊
11/18~ 精英資訊那邊
12/01~ 智邦提供部份頻寬

  • 為甚麼是叫 "台灣經濟圈"…

我本來是要寫 "台澎金馬關稅領域的",
嚴格說是不太想要去造成政治紛爭的, 而不得已的…
原本這句話是不存在的, 只是想寫台灣 blogosphere,
但這更難定義, 也還是會被說話, ….

  • 為甚麼不去做 Normalization?

一開始就想過要去做 Normalization 了,
因為所有的數字都有下限(0), 但沒有上限, 所以不太可能用甚麼方法去調整,
但許多數值還是差多的情型下就取了幾何平均來去突顯每個數值的角色,
甚至就網摘的觀點來看, 去做 normalization 反倒是加權了較少人用的系統.
而均數本來就是一種 Normalization, …
事實上我們用名次的序列來做 Normalization…

  • 為甚麼不取 Feedburner 的數值阿?

不希望數值是必須要由 Blogger 去加入與否, 造成相當差異的,
像 Technorati 的許多數字, 是自己抓來跑的,
不會因為 Blogger 須要去設定才會出現….

請大家提供意見

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-Share Alike 2.5 License.