iT邦幫忙

2023 iThome 鐵人賽

DAY 21
1

對於任何一個已經封裝完成,也就是格式為 *.otf 或是 *.woff 的字型來說,想要將其逆向拆包,可以使用 Python 的 fontTools 工具,或是 javascript 的 Fontkit 套件——換句話說,如果想要在瀏覽器上進行拆包,便是 Fontkit 大展神威的時候。

安裝

npm install fontkit

Webfont 分析

在這裡,我們選擇 Google & Adobe 的思源系列(Noto)作為示範,畢竟可以算是目前最廣為人知的開源字型,沒有之一。以思源黑體繁體中文(Noto Sans CJK TC)為例,可以在 Google Font 裡選擇 想要顯示的字重(font weight),以 Medium 500 這個字重為例,在我們 select 之後,可以在旁邊的側欄裡看到一串 css 代碼:

<style>
@import url('https://fonts.googleapis.com/css2?family=Noto+Sans+TC:wght@500&display=swap');
</style>

只要把這段貼到 <head> 裡面,就可以讓網頁直接使用了。不過,我們想要了解的是,其背後究竟是如何實現的?

當我們直接用瀏覽器打開 url 裡面的 Stylesheet 網址後,會看到一大串被分割的 @font-face ,像是這樣的格式:

/* [0] */
@font-face {
  font-family: 'Noto Sans TC';
  font-style: normal;
  font-weight: 500;
  font-display: swap;
  src: url(https://fonts.gstatic.com/s/notosanstc/v35/-nFuOG829Oofr2wohFbTp9ifNAn722rq0MXz75Ky_C9Otma2sNSJtzYHliyxLND4wBzNt2rB9nIRpa7KOq33sn8BIAlj5iM.0.woff2) format('woff2');
  unicode-range: U+1f921-1f930, U+1f932-1f935, U+1f937-1f939, U+1f940-1f944, U+1f947-1f94a, U+1f950-1f95f, U+1f962-1f967, U+1f969-1f96a, U+1f980-1f981, U+1f984-1f98d, U+1f990-1f992, U+1f994-1f996, U+1f9c0, U+1f9d0, U+1f9d2, U+1f9d4, U+1f9d6, U+1f9d8, U+1f9da, U+1f9dc-1f9dd, U+1f9df-1f9e2, U+1f9e5-1f9e6, U+20024, U+20487, U+20779, U+20c41, U+20c78, U+20d71, U+20e98, U+20ef9, U+2107b, U+210c1, U+22c51, U+233b4, U+24a12, U+2512b, U+2546e, U+25683, U+267cc, U+269f2, U+27657, U+282e2, U+2898d, U+29d5a, U+f0001-f0005, U+f0019, U+f009b, U+f0101-f0104, U+f012b, U+f01ba, U+f01d6, U+f0209, U+f0217, U+f0223-f0224, U+fc355, U+fe327, U+fe517, U+feb97, U+fffb4;
}

/* [6] */
@font-face {
  font-family: 'Noto Sans TC';
  font-style: normal;
  font-weight: 500;
  font-display: swap;
  src: url(https://fonts.gstatic.com/s/notosanstc/v35/-nFuOG829Oofr2wohFbTp9ifNAn722rq0MXz75Ky_C9Otma2sNSJtzYHliyxLND4wBzNt2rB9nIRpa7KOq33sn8BIAlj5iM.6.woff2) format('woff2');
  unicode-range: U+ff78-ff7e, U+ff80-ff86, U+ff89-ff94, U+ff97-ff9e, U+ffb9, U+ffe0-ffe3, U+ffe9, U+ffeb, U+ffed, U+fffc, U+1d7c7, U+1f004, U+1f0cf, U+1f141-1f142, U+1f150, U+1f154, U+1f158, U+1f15b, U+1f15d-1f15e, U+1f162-1f163, U+1f170-1f171, U+1f174, U+1f177-1f178, U+1f17d-1f17f, U+1f192-1f195, U+1f197-1f19a, U+1f1e6-1f1f5, U+1f1f7-1f1ff, U+1f21a, U+1f22f, U+1f232-1f237, U+1f239-1f23a, U+1f250-1f251, U+1f300, U+1f302-1f319;
}

…

為什麼會出現這麼多的 @font-face 屬性?雖然「思源黑體」是 一套 字型,但因為其包含的字數太多了(全部共有 65536 個字)。裡面有很多罕用字,而且也不是每一個常用字都會出現在網頁上。如果我們的網頁內文沒有某某字符,卻還是把整包字型抓下來,就白白浪費了下載和等待的時間。

因此,Google 將一套字型拆分成多個子字型檔案(subset font),並且透過 unicode-range 的方式限制取用,只有當想要顯示的字,出現在某個 @font-face 裡指定的 unicode-range 範圍時,才會真的從伺服器端下載 src*.woff 檔案;而那些沒有用到的字,自然而然就不需要浪費時間和空間載入了。

Emoji

同理,我們也可以用同樣的方法去查詢 Noto Color Emoji,在:

<style>
  @import url('https://fonts.googleapis.com/css2?family=Noto+Color+Emoji&display=swap');
</style>

的 stylesheet 裡面,透過直連,找到像是這樣的東西:

…
/* [8] */
@font-face {
  font-family: 'Noto Color Emoji';
  font-style: normal;
  font-weight: 400;
  font-display: swap;
  src: url(https://fonts.gstatic.com/s/notocoloremoji/v25/Yq6P-KqIXTD0t4D9z1ESnKM3-HpFabts6diysYTngZPnMC1MfLd4gw.8.woff2) format('woff2');
  unicode-range: U+200d, U+2640, U+2642, U+2695-2696, U+26f7, U+26f9, U+2708, U+2764, U+fe0f, U+1f33e, U+1f373, U+1f37c, U+1f384-1f385, U+1f393, U+1f3a4, U+1f3a8, U+1f3c2-1f3c4, U+1f3c7, U+1f3ca-1f3cc, U+1f3eb, U+1f3ed, U+1f3fb-1f3ff, U+1f466-1f478, U+1f47c, U+1f481-1f483, U+1f486-1f487, U+1f48b, U+1f48f, U+1f491, U+1f4bb-1f4bc, U+1f527, U+1f52c, U+1f574-1f575, U+1f57a, U+1f645-1f647, U+1f64b, U+1f64d-1f64e, U+1f680, U+1f692, U+1f6a3, U+1f6b4-1f6b6, U+1f6c0, U+1f6cc, U+1f91d, U+1f926, U+1f930-1f931, U+1f934-1f93a, U+1f93c-1f93e, U+1f977, U+1f9af-1f9b3, U+1f9b8-1f9b9, U+1f9bc-1f9bd, U+1f9cc-1f9cf, U+1f9d1-1f9df, U+1fa82, U+1fac3-1fac5;
}

接著,我們可以拿出 src 裡面的 woff 檔案,透過前天介紹Wakamai Fond 、或是上面提到的 fontkit,分析這個 *.woff2 的字型檔案:

const fontkit = require("fontkit");
const fontURL = "https://fonts.gstatic.com/s/notocoloremoji/v25/Yq6P-KqIXTD0t4D9z1ESnKM3-HpFabts6diysYTngZPnMC1MfLd4gw.8.woff2";

async function loadFont(fontPath) {
    const response = await fetch(fontPath);
    const arrayBuffer = await response.arrayBuffer();
    const buf = new Buffer(arrayBuffer);
    const font = fontkit.create(buf);
    console.log(font)
}

loadFont(fontURL);

這裡面就有我們想要的東西了。

Table

如 log 出來的結果所示,一個 OpenType 格式的檔案其實是由多個被稱作 table 的資料庫所組成。

舉例來説,和字型名稱、廠商、版權宣告、版本等有關的訊息,都會被放在 name table 裡面:

~ console.log(font.name)
> {version: 0, count: 8, stringOffset: 102, records: {…} ...}

// 字型名稱
~ console.log(font.name.records.fullName.en)
> Noto Color Emoji

// 字型版本
~ console.log(font.name.records.copyright.en)
> Copyright 2022 Google Inc.

而跟「替換」有關的 feature,像是我們提到的供 Emoji 使用的 ccmp feature,則是放在 GSUB 裡面:

~ console.log(font.GSUB)
> {version: 65536, scriptList: Array(2), featureList: Array(1), lookupList: LazyArrayValue ...}

// feature 的屬性名字
~ console.log(font.GSUB.featureList[0].tag)
> ccmp

至於彩色字型的 COLR/CPAL 的色版呢?則是在 COLRCPAL 的 table 裡面:

~ console.log(font.CPAL)
> {version: 0, numPaletteEntries: 1356, numPalettes: 1, numColorRecords: 1356 ...}

有沒有看到一些很熟悉的東西呢?像是基本色盤(base-palette)的數量(numPalettes)、每個色盤有幾個顏色(numPaletteEntries),所有色盤共有幾個顏色(numColorRecords)。如果我們拿 前天的 Rocher 來拆包的話,就會得到 11 個色盤、每色盤 4 色、共 44 色,和 [Wakamaifondue](https://wakamaifondue.com/) 的分析一樣!

~ console.log(font.CPAL)
> {version: 0, numPaletteEntries: 4, numPalettes: 11, numColorRecords: 44 ...}

而各個色盤的顏色(RGBA),則可以透過 colorRecords 這個 array 得到:

~ console.log(font.CPAL.colorRecords)
> (1356) { 0: {blue: 0, green: 0, red: 0, alpha: 255, parent: {…}, …}
           1: {blue: 102, green: 0, red: 0, alpha: 255, parent: {…}, …}
           ...
         }

有了字型資訊與色盤資訊,我們便有機會透過 @font-palette-values 屬性來玩顏色了。


上一篇
DAY 20|Emoji:可愛的小東西
下一篇
DAY 22|FontKit (2):CPLR 與 CPAL table
系列文
一起成為新世紀文字藝術師:深入玩轉 Unicode 和 OpenType30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言