如何在生成AI中利用OpenVINO™ 來加速運算

2024-07-11


生成式 AI 是甚麼?和 ChatGPT 有何分別?

生成式 AI ,能夠根據用戶的輸入來創造新內容。並且這些內容不限於文本,而是可以包括圖像、聲音,乃至於動畫和 3D 模型等其它類型。

生成式 AI 屬於深度學習 (Deep Learning) 的一個分支,通過學習數據中的規律或模式 (Pattern) 來生成新的內容。

目前,有一些模型使用大量數據資料進行訓練,而稱為基礎模型(Foundation Models),其中具有代表性的基礎模型有 ChatGPT,以及用於生成圖像的 Stable Diffusion 。如果使用少量的特定數據進行基礎模型的微調,就可以應用到許多不同使用場景的AI系統。

 

以下是對於ChatGPT和生成式 AI這兩個概念做個整理。

 

 

Intel OpenVINO™在Gen AI開發中的優勢及角色

在您的Intel® PC/NB上,就能擁有快速方便地AI開發體驗

 

 

 

 

 

 

 

GitHub還有超過100種的 Notebook 範例可參考 openvinotoolkit/openvino_notebooks

 

• 即時行人追蹤 (407-person-tracking-webcam)

• 即時物件偵測 (401-object-detection-webcam)

• 即時人體姿態推估 (402-pose-estimation-webcam)

• 即時動作識別 (403-action-recognition-webcam)

• 根據文字生成/補繪圖像 (236-stable-diffusion-v2)

• 影像工業儀表抄表器 (203-meter-reader)

• 語音音色複製與生成 (284-openvoice)

• LLM 聊天機器人 (254-llm-chatbot)

 

 

 

 

OpenVINO Notebooks 生成式AI相關範例

1.文字生成圖片

• 263-latent-consistency-models-optimum-demo

• Latent Consistency Model using Optimum-Intel OpenVINO

 

• 286-instant-id

• InstantID: Zero-shot Identity-Preserving Generation using OpenVINO

 

• 283-photo-maker-with-output

• Text-to-image generation using PhotoMaker and OpenVINO

 

• 278-stable-diffusion-ip-adapter-with-output

• Image Generation with Stable Diffusion and IP-Adapter

 

• 277-amused-lightweight-text-to-image-with-output

• Lightweight image generation with aMUSEd and OpenVINO

 

2.影像生成文字

• 233-blip-visual-language-processing

• Visual Question Answering and Image Captioning using BLIP and OpenVINO

 

• 281-kosmos2-multimodal-large-language-model-with-output

• Kosmos-2: Multimodal Large Language Model and OpenVINO

 

• 279-mobilevlm-language-assistant-with-output

• Mobile language assistant with MobileVLM and OpenVINO

 

• 257-llava-multimodal-chatbot-with-output

• Visual-language assistant with LLaVA and OpenVINO

 

• 209-handwritten-ocr-with-output

• Handwritten Chinese and Japanese OCR with OpenVINO

 

聯強代理SKHynix也將推出LPDDR5x LPCAMM2產品,SKHynix預計在2024年Q3將推出第一款LPCAMM2 產品,使用1anm 16Gb based LPDDR5x顆粒,支援7500Mbps速度,並提供16/32/64GB容量,到2025年的Q2則會進一步推出有8500Mbps速度的產品。

 

3.文字生成影片/ 文字生成音訊

• 253-zeroscope-text2video-with-output

• Video generation with ZeroScope and OpenVINO

 

• 236-stable-diffusion-v2-infinite-zoom-with-output

• Infinite Zoom Stable Diffusion v2 and OpenVINO

 

• 256-bark-text-to-audio-with-output

• Text-to-speech generation using Bark and OpenVINO

 

• 250-music-generation-with-output

• Controllable Music Generation with MusicGen and OpenVINO

 

• 284-openvoice-with-output.html

• Voice tone cloning with OpenVoice and OpenVINOVINO

 

 

* 若想了解更多資訊或有任何疑問,歡迎聯繫以下窗口 : CBGIntelFAE@synnex.com.tw

 

參考文獻

1. Synnex & Intel AI Workshop

2. https://www.preface.ai/blog/what-is-generative-ai/