More issues

關於開四停三的「大」數據迷思

新年回廣州探親,在親友車上,聽其誇耀現在廣州市的數據處理能力及規模的厲害。cctv滿街,最少一星期的視頻數據才能支撐得起那開四停三的厲政,這般那般。 當然了,我對中國挖掘個人數據的能力,是不會致疑的。要說當今世界對圖像的深度學習領域,中國必為前列。而其背後的主要推動,當然是監控的需求。 在這番共聚天輪的家庭閒聊之中,最叫我好奇的,是從技術角度能出發及解釋得了的一個問號 - 開四停三的數據規範。 首先,視頻數據是不會直接入庫的。視頻可以儲存,數據可以接某視頻或其分段,但沒有表是直接一個BLOB把視頻放進去的(嗯⋯⋯是沒有的🙈)。 想當然,分析也不會直接依賴原始數據,特別是視頻數據。 數據入庫 在視頻數據分析前,首先是feature extraction,這裡可以走過不少的pre processing pipeline,而對於非即時處理/管理的數據,會在提取完feature後,把feature入庫。走到這一步,可能只剩下車牌、地點、時間、型號⋯⋯此類的數據。而視頻可以作他用作冷數據分別保存。 數據分析 在進行數據分析時,當然不會在這大母體裡進行了。假如成千上萬的子程式同時
2 min read

你習慣了快,漸漸忘記怎樣慢

放心,這裡不會很溫吞地說的人生大道理,也稱不上什麼勸戒,只想分享一下一些從真實的觀察,整納出來的點點現象。 真的,我只怕當世人都習慣了快,便再沒有人懂怎樣慢。 這不懂,不是不明白的不懂,是不知怎做的不懂。 但為什麼大家仍那麼樂此不疲? 我想很大部分原因是大家都認為懂了跑,難道不懂怎去走?這比喻道理是正確,但其本身錯了⋯⋯ 如果說從速度出發,跑確是走的進階,但因其本身便是以快作本位的一個比較,那當然能順理成章的得出其結論。 那麼在一個本位不是快,速度的事物上引用這比喻呢?我想大家也很清楚,這是不恰當的。 在資源是恆定的世界,每一個決定都是對別的決定的妥協,所以在你快我也快的情況下,大家便很容易默認一些缺失是快的成本被放棄(很不中文,請見諒,再改善)。 而這些一個個被放棄的,理所當然是來自慢(別浪費時間討論個體別整體)。普遍的快,不是因爲你鉅細無遺地做好每件事仍很快,而是放棄做好每一步換來的快。那些被你放棄的,別說當你做起上來有多快,我更怕有一天你什至忘了有這一步(更何況只是大單位意義上的一步)。 啊。 別把tech debt拿出來說事,那是另一個層面的課題,大家只是個別時間點
3 min read

開發者該如何學習的角度看別人產品

作為一個開放者,我們該怎樣去看別人的產品? 要答這一個問題,便只能從所有軟件產品的根源說起⋯⋯ 電腦程式的本質,便是對電子活動的一層一層抽象。我們從電流的開合,數學的模擬,語言的整合,直到圖形系統,無一不是在更高的位面對低位面的一次抽象。 但即使是每天都進行著抽象活動的我們,也未必會時刻保持抽象的角度看待別人的產品。因為我們太習慣於具象的世界了。 上一次我看見的開發者集體跳崖事件,便是material design出現時。 抽象是一層一層地向上的,我們繼續談Material Design。 遊戲開始,請簡短說出什麼是Material Design。 3 2 1 ⋯⋯ 好了,對於你來說什麼是Material Design呢? 是卡片、圓角?陰影、過渡?還是飽和度/灰度展現層次? 以上的講法都很難說正確。我舉個例。本人在11年左右的作品已貫通整個App地大量使用圓角、陰影、卡片、灰度層次及少許仿冒物理的過渡,但他們便是Material Design嗎?但凡有以上原素的,便應該叫做Material Design嗎?(我想這也是很多人的疑問🤔️) 當然不是! M
4 min read

Subscribe to TechRD.in

Don’t miss out on the latest issues. Sign up now to get access to the library of members-only issues.
jamie@example.com
Subscribe