微軟推出 Windows AI Foundry:用于本地人工智能開(kāi)發(fā)的統(tǒng)一平臺(tái)
IT之家 5 月 20 日消息,在 Build 2025 開(kāi)發(fā)者大會(huì)上,微軟宣布了一系列針對(duì) Windows 平臺(tái)的 AI 開(kāi)發(fā)新工具與功能,其中包括 Windows AI Foundry 的推出,這一全新的統(tǒng)一平臺(tái)旨在為本地 AI 開(kāi)發(fā)提供強(qiáng)大的支持,整合了 Windows Copilot Runtime 以及多項(xiàng)新能力,進(jìn)一步推動(dòng) Windows 生態(tài)內(nèi)的 AI 應(yīng)用發(fā)展。

Windows AI Foundry 的推出標(biāo)志著微軟在本地 AI 開(kāi)發(fā)領(lǐng)域邁出了重要一步。該平臺(tái)通過(guò)整合 Windows Copilot Runtime 以及新增功能,為開(kāi)發(fā)者提供了一系列強(qiáng)大的工具和資源。Windows Copilot Runtime 已經(jīng)在 Windows 平臺(tái)上為本地 AI 應(yīng)用提供了支持,通過(guò) Windows AI API 和 Windows 機(jī)器學(xué)習(xí)(ML)功能,讓 AI 模型能夠在本地持續(xù)運(yùn)行。而 Windows AI Foundry 在此基礎(chǔ)上進(jìn)一步拓展,提供了即用型 AI API,這些 API 由內(nèi)置的 AI 模型驅(qū)動(dòng),能夠滿(mǎn)足開(kāi)發(fā)者在本地開(kāi)發(fā) AI 應(yīng)用時(shí)的多樣化需求。
此外,Windows AI Foundry 還提供了定制 Windows 內(nèi)置模型的工具,開(kāi)發(fā)者可以根據(jù)自身應(yīng)用的特定需求對(duì)模型進(jìn)行優(yōu)化和調(diào)整。該平臺(tái)還支持從 Azure AI Foundry 引入開(kāi)源模型,進(jìn)一步豐富了開(kāi)發(fā)者可使用的模型資源。同時(shí),它還提供了一個(gè)推理運(yùn)行時(shí),使得開(kāi)發(fā)者能夠?qū)⒆约洪_(kāi)發(fā)的模型輕松集成到應(yīng)用中。
在 AI 模型的集成方面,Windows AI Foundry 展現(xiàn)了強(qiáng)大的兼容性。它不僅整合了來(lái)自 Azure Foundry Local 的 AI 模型,還支持其他模型目錄,例如 Ollama 和 NVIDIA NIMs。微軟自身的 Foundry Local 模型目錄將提供經(jīng)過(guò)優(yōu)化的 AI 模型,這些模型能夠在 CPU、GPU 和 NPU 等多種硬件平臺(tái)上高效運(yùn)行。開(kāi)發(fā)者可以通過(guò)簡(jiǎn)單的“winget install Microsoft.FoundryLocal”命令來(lái)瀏覽、下載和測(cè)試與設(shè)備兼容的模型。一旦選定模型,開(kāi)發(fā)者可以利用 Foundry Local SDK 輕松將 Foundry Local 集成到自己的應(yīng)用中,大大降低了開(kāi)發(fā)難度和時(shí)間成本。
據(jù)IT之家了解,Windows ML 作為 Windows 內(nèi)置的 AI 推理運(yùn)行時(shí),是 Windows AI Foundry 的重要組成部分。其基于 DirectML 開(kāi)發(fā),能夠在包括 AMD、Intel、NVIDIA 和 Qualcomm 在內(nèi)的多種芯片平臺(tái)上高效運(yùn)行。Windows ML 的出現(xiàn)極大地簡(jiǎn)化了模型部署的流程,使得開(kāi)發(fā)者無(wú)需擔(dān)心未來(lái)硬件更新帶來(lái)的兼容性問(wèn)題。該運(yùn)行時(shí)能夠自動(dòng)更新所有必要的依賴(lài)項(xiàng),并在后臺(tái)自動(dòng)適配新的芯片架構(gòu),確保應(yīng)用的穩(wěn)定性和性能。
微軟還宣布了對(duì) LoRA(Low-Rank Adaptation)技術(shù)的支持,這一技術(shù)能夠在 Phi Silica 模型上實(shí)現(xiàn)對(duì)模型參數(shù)的小部分微調(diào)。通過(guò)使用自定義數(shù)據(jù)進(jìn)行微調(diào),LoRA 能夠顯著提升模型在特定任務(wù)上的性能表現(xiàn)。目前,LoRA 已經(jīng)作為 Windows App SDK 1.8 Experimental 2 的一部分進(jìn)入公開(kāi)預(yù)覽階段,并且已經(jīng)在 Snapdragon X 系列 NPU 上實(shí)現(xiàn)支持。未來(lái)幾個(gè)月內(nèi),LoRA 還將擴(kuò)展到 Intel 和 AMD 的 Copilot+ PC 上,為更多開(kāi)發(fā)者提供這一高效微調(diào)工具。
除了上述功能外,微軟還推出了新的語(yǔ)義搜索 API,幫助開(kāi)發(fā)者在其應(yīng)用中創(chuàng)建 AI 驅(qū)動(dòng)的搜索體驗(yàn)。這些 API 支持本地運(yùn)行,并且集成了 RAG(Retrieval-Augmented Generation)技術(shù),能夠提供更加智能和高效的搜索結(jié)果。目前,語(yǔ)義搜索 API 已經(jīng)在所有 Copilot+ PC 上進(jìn)入私有預(yù)覽階段,開(kāi)發(fā)者可以利用這些 API 將 AI 驅(qū)動(dòng)的搜索功能集成到自己的應(yīng)用中,為用戶(hù)提供更加個(gè)性化的搜索體驗(yàn)。
微軟 Build 2025 開(kāi)發(fā)者大會(huì)專(zhuān)題
來(lái)源:IT之家