逛 Dcard 的時候,最怕遇到文章不見、看不到福利圖片,特別是西斯板許多人會發了照片之後立刻刪除;或是原始貼文、圖片和留言,被原作者修改或刪除,或遭官方以「誤發表在不適當的看板」全文刪除!再加上 Dcard 頂端的站內搜尋功能非常奇怪,即便文章沒被刪掉,輸入完整標題做搜尋,也極有可能搜尋不到內容,不確定是否為官方演算法或是官方人為操作的結果
這時候可以用以下的方式,查詢網頁原始備份:透過第三方備份網站,如PTT brain,這個市面上唯一的工具,來搜尋原文、查到被刪掉的照片。過去可以使用深卡,但近期該網站已經下架了。可以將 PTT brain 視為 Dcard 文章搜尋引擎。更可以直接在上面透過搜尋 Hashtag 的方式,找到相關的貼文(例如:#disallowed_深卡)。雖然查詢這些資料並不違法,但切記不要惡意散佈
深卡的好處是備份的年份較長、文章數較多;PTT brain 則是介面易讀、可以透過卡稱看到發文者過去全部的貼文及留言等,也可以避免自己看到網軍帶風向的言論,還渾然不知(延伸閱讀:如何抓出公關公司假帳號的廣告業配文?)
這類第三方備份網站的原理,類似 Google 頁庫存檔的網頁快照技術(可以透過Cached Pages查詢,或是在搜尋時,點下「綠色網址欄最右邊的▼」,打開頁庫存檔),任何文章一旦貼在公開頁面,都會立刻被爬蟲檢索並儲存。
部份使用者可能還記得另外4個平台,暗卡(Darkka)、文章牛(Bullticle.com),也有類似的服務,但是這兩個平台已經停止運作了。透過社群巴斯(SocialBuzz)、SeeDcard(有人把它叫做 Dcard 攝影,但和 Dcard 攝影板 Photography 板無關),這兩個圖片牆平台,也能快速瀏覽西斯板的圖片,但是僅供瀏覽、連回原始貼文,並不支援備份功能。
社群巴斯僅能用來觀看熱門文章的封面縮圖,功能比較像是單純的第三方圖片閱讀器、類似 Instagram 風格的圖片牆,並不支援文章及圖片備份,如果想看到原文,必須按下「另開連結前往 Dcard 網站」,不但不能備份圖片,甚至只能看到該文章的封面照、看不到文章中的其他圖片;SeeDcard 則是可以用來觀看最新文章中的所有圖片,類似 Pinterest 風格的圖片牆,但一樣不能備份文章及圖片
文章結構
PTT brain 是什麼?
任何人都可以到PTT Brain官網:https://www.pttbrain.com,透過搜尋卡稱或文章標題或部份文章內容,找出被刪除或修改的原始文章。(延伸閱讀:PTT 肉搜教學)
深卡是什麼?
深卡 observer 是 Dcard 的文章備份網站之一,也有人筆誤打成「obverse 伸卡」,和 Dcard 狄卡科技官方毫無關係,深卡是由第三方平台卡新聞團隊在2017年2月26號建置完成,經年累月下來,爬到的資料比PTT brain多,是市面上最多低卡文章的備份網站。但深卡只能用來搜尋備份文章,沒辦法像PTT brain一樣,查到更多卡稱的詳細資料(如每天的回覆、生活作息圖等,延伸閱讀)。
深卡專注在提供兩項功能:功能強大的文章搜尋引擎,以及用最簡易的方式,匿名贊助該文章的作者。站在頁庫存檔、快取網站的角度,深卡等第三方平台是合法的,Google 在 2006 年有和其他人打過頁庫存檔的官司,最後判決勝訴,因為儲存 Cache 是現代搜尋引擎必備的功能
深卡如何使用?
任何人都可以到深卡網站:https://tw.observer,透過搜尋文章標題或部份文章內容,找出被刪除或修改的原文
深卡為何會爆紅?
深卡備份了許多看板的文章,但一夕爆紅的主要流量來源,是從西斯板文章開始。Dcard SEX板(西斯板)除了是 Dcard 最多人追蹤的看板(各板追蹤人數排行榜)之外,西斯的瀏覽量高達 Dcard 網站總流量的 1/3,根據 Dcard 官方廣告業代的說法,Dcard 西斯板每天約有一百萬左右的不重複瀏覽量。網站圖片按右鍵,即可看到該圖在圖床上的開啟次數,通常都落在幾萬至幾十萬,非常嚇人,可說是多數人使用 Dcard 匿名社群平台的主要原因。加上2017年深卡剛開始營運時,適逢 Dcard 西斯板隱板(看板被官方隱藏,使用者完全找不到西斯板和板上的內容),深卡因此湧入了大量人潮。許多資深的 Dcard 卡友,會透過深卡來看西斯,深卡又被稱作 Dcard 的西斯神器。比較懶惰的SEX板使用者,會直接搜尋「深卡奶樓」等關鍵字,一次看一堆奶照
西斯板上常常有人Po性感照,並在幾分鐘後刪除該照片,或是放露點照,但是幾分鐘後會被官方依版規刪除。然而,這種方式完全無法阻止照片外流,文章或留言在Po出的當下,就會立刻被 Google 頁庫存檔,以及坊間所有的第三方平台網站時光機(Wayback Machine)平台,備份到外部資料庫中
如何防止深卡爬我的D卡文章?
發文者只要在文章中任何一行的句首,輸入「#DISALLOW深卡」或是「#PRIVATE_CONTENT」,該則貼文就不會被深卡爬蟲,輸入大小寫皆可,深卡之所以會要求輸在句首,很有可能是為了減輕他們伺服器的負擔,否則大量文章爬下來,非常消耗伺服器的效能。標註上這個Hashtag後,原Po在同篇貼文的留言處回任何文字,也不會被爬到,會被深卡用?符號蓋過,但是該則貼文中其他人的留言還是會被爬到,如下圖所示;假如其他留言者不希望自己的留言被深卡複製,可以在留言第一句寫#DISALLOW深卡,該則留言一樣不會被爬到。但如果只標註#DISALLOW暗卡,還是會被深卡爬,因為這個指令只能用來防暗卡爬蟲
雖然輸入了這兩個 Hashtag,就不會被深卡爬到,但該篇文章仍然會被 Google 的頁庫存檔儲存,以及其他的第三方平台爬到。簡言之,在文章公開發佈的那一刻開始,這篇文章就已經不可逆地外流了,除非一一申請下架,否則幾乎沒有任何方法可以完全杜絕其他人備份
如何下架自己在深卡上面的文章?
可以直接截圖「能夠證明自己是原Po的照片」,或是「可編輯文章的畫面」且該畫面中不得押任何浮水印,傳給深卡官方,即可申請文章下架
如何防止第三方備份平台,備份我 Dcard 上的圖片?
世界上沒有百分百防範外流的方法,但有兩種變通方式可以稍微緩解這個問題,一是等爬蟲平台爬完再修改文章,二是使用第三方圖床。有的人會選擇,先隨便Po一篇文,等到該文已被第三方平台爬蟲後,再回到 Dcard 編輯文章、在文章內上傳圖片,用這樣的方式避免照片被第三方平台爬蟲。然而,這種方式還是有可能遇到,爬蟲軟體回頭重爬的風險;以及這樣的方式根本無法擋掉 Google 本身的頁庫存檔,以及 Wayback machine 等,因為這兩個平台每隔一陣子就會回去重新爬蟲。
Dcard 使用短網址上傳圖片,避免圖片外洩,這招未必有效!
有的人在 Dcard 發文附圖時,會預先將圖片上傳至第三方圖床並上鎖,這招可以防止爬蟲軟體爬到圖片,但無法阻止圖片外洩。以卡友們常用的 risu.io 縮網址 為例,雖然可以掌控「圖片的刪除權」,可以限時刪圖或是自主刪圖,以防範深卡等機器人爬蟲;然而,第三方圖床無法避免照片被竊取並外流的可能性,因為許多圖床公司自己就常常透過,變賣使用者的照片來盈利,以 risu.io 為例,只要是他們的付費會員,就可以輕鬆看到所有過期失效的連結
懶一點的方法是,等圖床自己刪除該圖片。以imgur圖床為例,如果半年內圖片都沒有被預覽(自動開啟也算)或點擊瀏覽,免費圖片空間的伺服器,就會自動將此照片檔案刪除。然而以西斯版如此海量的流量來看,這個懶人方法很有可能沒有效果
其他已無法使用的備份網站
暗卡是什麼?
暗卡也是第三方備份平台,但是他們除了備份、搬運文章到自己的平台上之外,還把西斯板的圖片排版成類似IG的介面,並透過招收付費會員的會費,來支持平台營運。種種爭議導致他們在2020年,自行暫時關閉了
社群巴斯是什麼?
社群巴斯像是一個大型的社群儀表板,上面串接各大頻道的熱門社群動態,包含圖片縮圖及原文連結、影片連結,方便使用者直接按下「另開連結前往 Dcard 網站」,點去該平台上閱讀
因此社群巴斯僅能用來觀看熱門文章的封面圖,功能比較像是單純的第三方圖片閱讀器,方便使用者使用者像滑動IG一樣,快速觀看圖片
但並不支援文章及圖片備份,甚至只能看到該文章的封面照、看不到文章中的其他圖片。社群巴斯的搜尋功能也非常差,即便把標題完整複製貼上,也經常查不到該篇文章
Dcard X 是什麼?
是官方推出的另一款安卓手機版 Dcard APP,可以看到成人版面。礙於Google政策,Android 版的 Dcard APP,並未支援18禁的看板,因此必須額外透過APK檔,在手機內灌 Dcard X APP,才能收看成人看板(如西斯板);iOS 系統沒有這個限制,因此 iPhone 無需使用 Dcard X。Dcard X 的介面和 Dcard 原版一致,但是在操作體驗上,部份使用者反應其頁面開啟速度,有時較原版來得慢一點點
深卡的爭議?
深卡幾乎是市面上最早在做 Dcard 文章爬蟲備份的內容農場,因此所有砲火多集中在他們身上。他們過去有過的爭議如下:
1. 網址侵權:
2017年深卡創立初期,網域域名(Domain name)為 dcard.tw.observer 和 Dcard 的 dcard.tw 很像,因此被 Dcard 官方警告,後改為 tw.observer ,如下圖所示:
2. Dcard使用者普遍不知道有第三方備份平台的存在:
PTT 一直以來都有一堆備份網站,搬運PTT的內容,這類內容農場最常見的商業模式是,將文章拷貝至自家平台後,再於自家頁面中埋入廣告版位,透過廣告聯播網賺錢。只要寫好程式和UI設計,PTT鄉民就會源源不絕地寫文章,備份網站也可以瘋狂產生新文章,等哪天有人透過搜尋引擎查找相關關鍵字時,就有一定的機會點進備份網站,進而為這個第三方平台賺取利潤。PTT 上備份得最完全的網站是 pttweb.cc 以及 PTT brain(延伸閱讀:批踢踢肉搜方式完整介紹)
這類型的爬蟲程式並不困難,任誰都可以製作,只是差在願不願意公開營運而已,深卡及PTT brain,是市面上唯二公開運作的Dcard文章備份工具;即便這世界上沒人透過爬蟲做搬運,搜尋引擎自己也會透過頁庫存檔(Cached)進行備份,目的是當使用者在使用Google時,想點進網頁,卻因為網路塞車或是網站壞掉等情況,導致網站打不開、無法順利連結,這時就可以透過頁庫存檔,透過網站快照瀏覽該網站的內容
然而 Dcard 的使用者,多半沒有使用 PTT 發文,並且被轉載的經驗,在他們的人生中多數只用過 Facebook、Instagram 和噗浪、巴哈等,多為較封閉、無人搬磚拷貝的平台,FB的封閉之處在於,他們會刻意把大量內容鎖在臉書內部,外部人員難以透過 Google 找到臉書裡面的內容,FB希望藉此提高大眾註冊及使用臉書的機會,加上臉書的文章隱私權限非常容易設定,因此對使用者而言,公開貼文和私人貼文之間的界線分得非常清楚。D卡使用者就是因為看中 Dcard 匿名平台這個特質,才選擇用 Dcard 的,因此對他們而言,這些文章並非公開資訊,而是比較公開的私人社群
因此D卡卡友們多數都無法想像,這世界上竟然有「外部備份」這種事發生。但其實IG本身也有很多外部備份網站,透過相同的「搬磚+廣告欄位」模式來盈利,只是滴卡使用者剛好不知道而已
卡友們普遍認為自己享有該篇貼文的完整著作權,任何人在備份或引用、轉載前,都會主動聯繫自己,即便是匿名發文,引用者或轉載者也要到原始貼文底下,詢問原Po;甚至多數 Dcard 使用者會在心裡預設:只要創作者沒有打上「歡迎轉載」字樣,該篇文章便不得隨意轉載,否則形同觸犯該作者的智慧財產權(a.k.a. 自己的創作被偷走了),然而這件事弔詭之處在於,Dcard 屬於公開平台,公開平台上的文章是否屬於公開貼文?轉分享是否為侵犯智財權?這幾點仍存在許多爭議,特別是這類型的第三方平台,通常每篇都有註明作者,以及文章來源出處;雖然設有廣告板位,但並非直接販售該智慧財產權來牟利,因此D卡使用者在法律上或許不容易抗告成功
對於此類平台,Dcard 官方表示無能為力。因為關於著作所有權的法律行為,必須由文章作者本人進行主張申訴,因此當使用者認為自己的文章著作權遭到侵犯時,必須自行前往報案,Dcard僅能在收到檢調單位來函後,提供相關資料協助辦理,無法代替使用者,對外呼籲並根絕這類搬運行為
爬蟲抓文和 Dcard 的個資被盜是兩回事,爬蟲是抓前端資料,會員個資是保存在後台的,雖然 Dcard 無法杜絕別人爬前端資料,但不代表他們在後端的防護力很差,再加上,現在西斯版已有 robot.txt 防護,簡單地告知搜尋引擎不要索引SEX板上的文章,理論上西斯不會再被搜尋引擎及 Wayback Machine 備份了,然而 robot.txt 並沒有強制性,加了還是可能被爬文
Dcard 使用者對於自己正在使用的平台,不知道的事其實還蠻多的,例如 Dcard 的多數版面雖然可以匿名發文、回應,但是官方為了控管論壇風氣(如同我之前在好物研究室文章中提到的,官方權力極大)、避免使用者糾紛,狄卡科技內部的人,都可以從後台輕易查出發文者的身份,因此這個匿名並非卡友們想像中的那麼隱密,在上面匿名嗆人不要太嘴☺️
3. 商業模式有點爭議:
許多激進的使用者會責備第三方備份平台的營利行為,但這些平台在做的事情,其實只是網站時光機(Wayback Machine),類似Google頁庫存檔的邏輯。即便部份平台甚至沒有在網站上放廣告欄位、並未從中獲利,Dcard 卡友還是普遍認為他們正拿著自己的智慧財產在外牟利。部份迪卡使用者認為,寫上「#DISALLOW深卡」,形同是在幫深卡打廣告,照做的話反而會吸引更多人前去看這個盜文網站上的其他文章,而且即便標註了 Hashtag 也無法100%確定,深卡真的不會爬自己的文章(根據深卡的系統,事實上是真的不會),因此 Dcard 的使用者對這個 Hashtag 感到非常憤怒
從法律意義上來看,匿名寫作如可證明是自己的文章,作者便可主張該文章的一切權利;但事實上,社會的運作並不如此,連 Dcard 官方也常常私自把文章轉去自家粉絲團,原Po發現後,常常會把該貼文刪除,以致於多數人常常在臉書上,看到別人轉載的 Dcard 文打不開,或打開後已被刪除
深卡的商業模式爭議,除了在廣告欄位上,還有「贊助作者計畫」。該計畫的細節為:只要喜歡的文章作者,有在深卡註冊並綁定自己的臉書帳號,當他粉絲在深卡閱讀到他的文章,萌生想Donate他的念頭時,就可以透過比特幣交易,把贊助金匯給創作者本人,深卡會從中收取5%處理費,支付比特幣的微量轉帳費用,以及深卡伺服器營運及人力成本;假如創作者沒有註冊帳號,則該筆交易不會成立。許多Dcard使用者認為這個收費機制大有問題,特別是會員綁定FB個資這點,但深卡表示只需要連動FB,不會要求其他個資