Pinned66個大型語言模型LLM經典論文去年ChatGPT的發布,帶動了大型語言模型(Large Language Models, LLM)的風潮,這幾周更是進入了白熱化階段,除了有科技巨頭發布的GPT-4V、Gemini、Claude和Grok,開源模型更是百花齊放,包括了Llama 2、Mixtral…Dec 17, 20231Dec 17, 20231
66個視覺語言模型VLM經典論文隨著各個大型語言模型LLM的進展,也開始帶動了視覺語言模型VLM的發展,最經典的模型像是GPT-4V和Gemini,以及開源社群LLaVA等,所以今天要來帶大家看我自己看過的各個經典視覺語言模型論文,另外這邊一樣我會按照時間順序列出來,不過這篇不包含影音模態,也不包含影像和影片生…Dec 21, 2023Dec 21, 2023
深度學習Paper系列(15):U-GAT-IT前幾回當中我們介紹了幾個Unpaired image-to-image translation的模型,今天我們也要來介紹另一個重要的影像轉換模型「U-GAT-IT」,其論文名稱叫做:Dec 8, 2023Dec 8, 2023
深度學習Paper系列(14):DRIT上一回當中,我們介紹了Multimodal的Unpaired image-to-image translation模型 — MUNIT,今天我們要來介紹另一個同樣是Multimodal的影像轉換模型「DRIT」,其論文名稱叫做Dec 6, 2023Dec 6, 2023
深度學習Paper系列(13):MUNIT上一回我們介紹了UNIT這個unpaired image-to-image translation的模型,今天我們要來更進一步的介紹UNIT後來的改進版本,也是我們今天要介紹的「MUNIT」,其論文名稱叫做:Dec 5, 2023Dec 5, 2023
深度學習Paper系列(12):UNIT上一回我們介紹了VAE-GAN的架構,其把兩個不同的生成模型VAE和GAN做結合。而我們今天要介紹的這個模型,是基於VAE-GAN的unpaired image-to-image translation模型 — UNIT,其原始論文名稱叫做:Nov 29, 2023Nov 29, 2023
深度學習Paper系列(11):VAE-GAN在前幾回當中,我們有提到GAN和VAE的基礎,我們也知道這兩個模型架構都是屬於生成式模型,都可以用來生成圖片,但實際上這兩者背後的原理其實是不太一樣的。Nov 27, 2023Nov 27, 2023