CantoneseLLM v2 beta

CantoneseLLM is the continuous work by hon9kon9ize.

This model is based on Gemma3-4B. By continuous pre-training (CPT), supervised finetuning (SFT) and model merging with the original Gemma3 4B model, we have created the best in-class open weight model.

We will include more data in both CPT and SFT, as well as merge with other models to further enhance capabilities, especially in long-context capabilities.

Usage (vllm):

vllm serve "jed351/Gemma3-4B-ChatVector_SFT-from-IT_and_IT" \
    --dtype auto \
    --host $MASTER_ADDR \
    --max-model-len 4096 \
    --limit-mm-per-prompt '{"image": 0, "video": 0}' # multimodality must be disabled
from openai import OpenAI
import time

client = OpenAI(
    base_url="http://{address}:{port}/v1",
)

instruction = """You are CantoneseLLM, an AI assistant that provides accurate and concise information developed by hon9kon9ize."""

completion = client.chat.completions.create(
  model=model_path,
  messages=[
    {"role": "system", "content": instruction},
    {"role": "user", "content": {your_prompt}},
  ],
)

Example Comparison Between This Model and the original Gemma3 4B-it

Question: 「濕濕碎」、「求其」、「hea做」呢啲日常講嘅詞語,你會點樣向一個唔識廣東話嘅 外國人解釋?試舉實際例子說明裏面嘅用法同埋背後嘅文化意義。

This model (although the answer is shorter than Gemma3 4B-it, it is correct)

「濕濕碎」:呢個詞語嘅意思係「廢話」、「無聊嘢」、「吹水」噉解。佢嘅語氣好直
接,帶有啲批評嘅意味。
* **例子:** 假設你朋友話:「我琴日贏咗個大獎呀!」你就可以回應:「濕濕碎,你
平時成日都話自己贏晒,下次先講啦。」
* **文化意義:** 廣東人好鍾意用呢啲口語表達,表達對某啲說話嘅不滿或者質疑。
「求其」:呢個詞語嘅意思係「隨便」、「隨機」、「唔理咁多」噉解。
* **例子:** 你想食嘢,但係唔想諗咁多,你可以同朋友講:「食咩求其啦。」
* **文化意義:** 廣東人好講求效率,所以成日用呢啲詞語嚟簡化流程同埋減少思考。
「hea做」:呢個詞語嘅意思係「懶做」、「敷衍」、「唔認真」噉解。
* **例子:** 你嘅同事交份報告,但係份報告好潦草,你就可以話:「佢hea做,份
報告都唔肯認真寫。」
* **文化意義:** 廣東人對工作嘅態度有時比較隨性,所以「hea做」呢個詞語都幾常
見。
希望呢啲解釋對你嘅朋友有幫助!

Gemma3 4B-it (talking about non-sense)


**1. 「濕濕碎」 (Sut Sut Sau)**

* **解釋方向:**  「濕濕碎」嘅意思可以理解成表達輕微嘅失望、不滿、或者認為某件事唔夠理想。但係,佢唔係一個嚴肅嘅批評,而係一種帶有幽默嘅方式表達。
* **例子:**
    * **情景:** 朋友做咗個野,但係結果好唔好笑,唔符合預期。
    * **廣東話:** 「佢咁做,結果好濕濕碎啊!」
    * **英文翻譯:** "It turned out so badly, it's a bit disappointing and funny at the same time." 或者 “That's a bit of a letdown, but in a silly way.”
* **文化意義:**  喺廣東文化,「濕濕碎」反映咗一種樂觀嘅態度。即使有失望嘅時候,都唔應該過份沮喪,可以輕輕一笑,然後繼續去做嘢。  佢係一種消極但又帶有娛樂性質嘅表達方式。

**2. 「求其」 (Kau Kei)**

* **解釋方向:** 「求其」字面意思係「隨便」、「隨意」。但係,佢唔單止係指隨意做嘢,更暗示咗一種放鬆、輕鬆嘅心情,唔需要拘泥於細節。
* **例子:**
    * **情景:**  兩個朋友一齊去街邊,唔知道食咩好。
    * **廣東話:**  「食咩求其啦,你想食乜就食乜。」
    * **英文翻譯:** "Just order whatever you feel like, don't worry about it." 或者 “Feel free to choose anything you want.”
* **文化意義:**  「求其」反映咗廣東人嘅生活態度 – 享受當下、唔好過份計較。 喺工作或者社交場合,如果有人問你「你想做咩?」你可以用「求其」嚟表示你想自由發揮,唔好俾人限制。

**3. 「hea做」 (Hoi2 Duk2)**

* **解釋方向:** 「hea做」嘅意思係「無事做」、「打發時間」、「消磨時間」。佢唔係指有目的嘅工作,而係指做啲唔重要嘅嘢,純粹因為好樂在其中。
* **例子:**
    * **情景:**  朋友無事做,就去街邊睇人、食嘢、或者聽街頭音樂。
    * **廣東話:**  「我今日就hea做做,好開心!」
    * **英文翻譯:** "I'm just going to chill and do nothing, it's really enjoyable." 或者 "I'm going to just hang out and have fun."
* **文化意義:**  「hea做」反映咗廣東人嘅生活方式 – 享受生活、唔好過份重視工作。 喺廣東文化,有時「無事做」就代表一種自由、放鬆嘅狀態。  呢個習慣好普遍,反映咗人哋唔想一直工作,希望有啲時間嚟放鬆自己。

**總結:**

向外國人解釋呢啲廣東話用語,最重要係要將佢哋嘅文化意義融入到解釋當中。 唔好淨係講字面意思,要講俾佢哋理解到,呢啲用語反映咗廣東文化嘅價值觀同埋生活態度。

**額外提示:**

* **用比較嘅方式:**  可以將呢啲用語同埋其他語言嘅同類型詞語比較,例如英文嘅 “hang out”、“to goof around”、“to kill time” 等。
* **強調語境:**  要強調同一個詞語喺不同語境下嘅不同意思,例如「濕濕碎」可以表達輕微嘅失望,但係亦可以表達幽默嘅態度。
* **保持耐心:**  向唔識廣東話嘅人解釋嘢,一定需要保持耐心,用易懂嘅方式,多啲例子,俾佢哋逐步理解。

希望呢啲解釋同埋例子對你有幫助!
Downloads last month
495
Safetensors
Model size
4B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support