如何在生成AI中利用OpenVINO™ 來加速運算
2024-07-11
生成式 AI 是甚麼?和 ChatGPT 有何分別?
生成式 AI ,能夠根據用戶的輸入來創造新內容。並且這些內容不限於文本,而是可以包括圖像、聲音,乃至於動畫和 3D 模型等其它類型。
生成式 AI 屬於深度學習 (Deep Learning) 的一個分支,通過學習數據中的規律或模式 (Pattern) 來生成新的內容。
目前,有一些模型使用大量數據資料進行訓練,而稱為基礎模型(Foundation Models),其中具有代表性的基礎模型有 ChatGPT,以及用於生成圖像的 Stable Diffusion 。如果使用少量的特定數據進行基礎模型的微調,就可以應用到許多不同使用場景的AI系統。
以下是對於ChatGPT和生成式 AI這兩個概念做個整理。
Intel OpenVINO™在Gen AI開發中的優勢及角色
在您的Intel® PC/NB上,就能擁有快速方便地AI開發體驗
GitHub還有超過100種的 Notebook 範例可參考 openvinotoolkit/openvino_notebooks
• 即時行人追蹤 (407-person-tracking-webcam)
• 即時物件偵測 (401-object-detection-webcam)
• 即時人體姿態推估 (402-pose-estimation-webcam)
• 即時動作識別 (403-action-recognition-webcam)
• 根據文字生成/補繪圖像 (236-stable-diffusion-v2)
• 影像工業儀表抄表器 (203-meter-reader)
• 語音音色複製與生成 (284-openvoice)
• LLM 聊天機器人 (254-llm-chatbot)
OpenVINO Notebooks 生成式AI相關範例
1.文字生成圖片
• 263-latent-consistency-models-optimum-demo
• Latent Consistency Model using Optimum-Intel OpenVINO
• 286-instant-id
• InstantID: Zero-shot Identity-Preserving Generation using OpenVINO
• 283-photo-maker-with-output
• Text-to-image generation using PhotoMaker and OpenVINO
• 278-stable-diffusion-ip-adapter-with-output
• Image Generation with Stable Diffusion and IP-Adapter
• 277-amused-lightweight-text-to-image-with-output
• Lightweight image generation with aMUSEd and OpenVINO
2.影像生成文字
• 233-blip-visual-language-processing
• Visual Question Answering and Image Captioning using BLIP and OpenVINO
• 281-kosmos2-multimodal-large-language-model-with-output
• Kosmos-2: Multimodal Large Language Model and OpenVINO
• 279-mobilevlm-language-assistant-with-output
• Mobile language assistant with MobileVLM and OpenVINO
• 257-llava-multimodal-chatbot-with-output
• Visual-language assistant with LLaVA and OpenVINO
• 209-handwritten-ocr-with-output
• Handwritten Chinese and Japanese OCR with OpenVINO
聯強代理SKHynix也將推出LPDDR5x LPCAMM2產品,SKHynix預計在2024年Q3將推出第一款LPCAMM2 產品,使用1anm 16Gb based LPDDR5x顆粒,支援7500Mbps速度,並提供16/32/64GB容量,到2025年的Q2則會進一步推出有8500Mbps速度的產品。
3.文字生成影片/ 文字生成音訊
• 253-zeroscope-text2video-with-output
• Video generation with ZeroScope and OpenVINO
• 236-stable-diffusion-v2-infinite-zoom-with-output
• Infinite Zoom Stable Diffusion v2 and OpenVINO
• 256-bark-text-to-audio-with-output
• Text-to-speech generation using Bark and OpenVINO
• 250-music-generation-with-output
• Controllable Music Generation with MusicGen and OpenVINO
• 284-openvoice-with-output.html
• Voice tone cloning with OpenVoice and OpenVINOVINO
* 若想了解更多資訊或有任何疑問,歡迎聯繫以下窗口 : CBGIntelFAE@synnex.com.tw
參考文獻
1. Synnex & Intel AI Workshop
2. https://www.preface.ai/blog/what-is-generative-ai/