向山/尤基/松島宏作品

第一百四十二章更多問題

 

    向山大概聽明白了。

    或者說，唯一讓向山懵逼了一瞬間的，也就是英格麗德舉出的那個例子。

    他沒想到會在這種場合聽到這種……奇怪的例子。

    但是，除此之外，好像並沒有什麼更有價值的東西。

    只能說，任何專業人士，在超出自己專業領域之後,就不比一般人更加智慧吧。

    雖然在英格麗德眼中，這些外星人的書寫方式有趣極了，但歸根結底，這就是一種壓縮算法。

    而這無法解釋向山現在在琢磨的問題。

    “所有外星機械的設計圖紙、裝配工藝、材料製造的參數，再加上它們自身運行的ai，加在一塊，是如何壓縮到兩三百mb這個水平的”。

    外星人使用了兩種壓縮算法。

    一種大致可以稱作“字典算法”,即“將高頻出現的排列組合用,做成對應字典,然後用字典內編號代碼來替代該組合”。這種手段人類也在使用。當然，如果“字典”做得很大，那麼數據本體就可以壓縮得很小。但有些時候，又會形成“字典比數據本體還要大”的情況。

    外星人大概是選擇了一個恰好的數值，保證“本體+字典”的大小最小。

    另外就是英格麗德所說的這種二維的符號矩陣。

    但不管怎麼樣，信息的無損壓縮一定是有極限的。

    而這種二維矩陣的算法，不管外星人將讀取規則設計得怎樣花裡胡哨，它都存在一個“上限”的。

    就如英嘉所說，如果多增加一個“下一個終止/方向符號無效”的符號，固然可以增加讀取路線的數量，但是卻會導致符號之中混入大量除了表示“下一個終止/方向符號無效”之外沒有其他任何意義的符號,“字典”的集合之中也要增加項目。

    “讀取路線”的增加，會導致“摻雜過多隻與讀取規則有關的符號”以及“字典”的膨脹。

    同字典算法一樣,到最後,同樣也會出現“讀取規則”大小大於數據本體大小的問題。

    這裡面同樣

    存在一個平衡點。

第一百四十二章 更多問題

第一百四十二章更多問題