有......" />
北京2025年8月5日 /美通社/ -- 亞馬遜云科技日前宣布,推出Amazon Nova Act SDK有限預(yù)覽版,可快速幫助客戶將基于瀏覽器的Agent從原型部署至生產(chǎn)環(huán)境。該SDK可與亞馬遜云科技的多項服務(wù)集成,包括用于安全身份管理的Amazon Identity and Access Management (Amazon IAM)、用于數(shù)據(jù)存儲與策略控制的Amazon Simple Storage Service (Amazon S3),以及全新推出的、支持大規(guī)模云端瀏覽器執(zhí)行的Amazon Bedrock AgentCore Browser Tool。
Amazon Nova Act SDK最初于2025年初以研究預(yù)覽版形式推出,旨在幫助開發(fā)者構(gòu)建可穩(wěn)定完成網(wǎng)頁任務(wù)的Agent。隨著企業(yè)對自動化能力的需求不斷增長,該SDK在眾多實際業(yè)務(wù)場景中得以落地,成為推動Agent流程自動化的重要工具,具備高可靠性、靈活性與可擴展性。
傳統(tǒng)業(yè)務(wù)自動化流程面臨的挑戰(zhàn)
日常業(yè)務(wù)操作往往依賴瀏覽器,例如提交休假申請、處理發(fā)票、訪問供應(yīng)商門戶或查看儀表盤。由于缺乏API覆蓋,許多流程仍需手動完成:團隊需要在多個標簽頁間復(fù)制粘貼數(shù)據(jù),手動執(zhí)行多步驟流程,點擊大量界面來完成工作。
傳統(tǒng)基于規(guī)則的瀏覽器自動化框架在動態(tài)網(wǎng)頁環(huán)境中面臨諸多挑戰(zhàn)。頁面結(jié)構(gòu)的微小變化(如新增表單字段或下拉選項)常常導(dǎo)致選擇器失效,團隊需要投入大量精力進行維護,而非構(gòu)建新的自動化任務(wù)。更重要的是,這類框架難以擴展。例如,若某一業(yè)務(wù)場景需要在50個不同網(wǎng)站上運行,團隊就必須構(gòu)建50套特定自動化邏輯,因為基于規(guī)則的框架無法泛化。
人類執(zhí)行任務(wù)的能力可以適應(yīng)不同的工具和界面。例如,掌握了如何在Outlook中撰寫郵件后,即使從未使用過Gmail,也能在其中完成同樣的任務(wù)。大型語言模型(LLM)通過海量用戶界面訓(xùn)練樣本,賦予AI Agent類似于人類的這種識別能力。憑借語言理解、指令執(zhí)行和跨領(lǐng)域推理能力,大語言模型已廣泛應(yīng)用于聊天、摘要生成、編程助手等場景。如今,生成式AI正邁入"以行動為核心"的新階段。Agentic AI在大語言模型基礎(chǔ)上向執(zhí)行層延伸,旨在完成動態(tài)、多步驟的復(fù)雜流程,如填寫復(fù)雜表單、與不斷變化的界面交互,或大規(guī)模完成真實業(yè)務(wù)任務(wù)。Agentic AI并非取代大語言模型,而是對其進行擴展,釋放新的自動化能力,讓我們在企業(yè)環(huán)境中更接近真正的任務(wù)完成。
借助Amazon Nova Act SDK實現(xiàn)Agentic AI
借助Amazon Nova Act SDK,客戶能夠構(gòu)建并部署可靠的瀏覽器Agent,這些Agent由專為Agentic AI打造并精調(diào)的Amazon Nova Act模型驅(qū)動。該模型經(jīng)過強化學(xué)習(xí)訓(xùn)練,并結(jié)合大量瀏覽器交互領(lǐng)域數(shù)據(jù),能夠精準執(zhí)行逐步工作流程。在最新版本中,亞馬遜云科技通過服務(wù)集成進一步擴展了這一功能,使客戶能夠?qū)gent從原型轉(zhuǎn)化為生產(chǎn)環(huán)境。用戶只需一條命令即可安裝SDK,使用Python和自然語言編寫Agent、實時調(diào)試,并可直接集成至持續(xù)集成與交付(CI/CD)流程中。通過亞馬遜云科技提供的企業(yè)級安全性、可觀測性和基礎(chǔ)設(shè)施,Amazon Nova Act SDK為希望構(gòu)建可大規(guī)模和可交付的Agent的團隊提供了一條快速、靈活的路徑。用戶只需一條命令即可完成安裝,可使用Python和自然語言的組合方式編寫Agent,在工作流運行期間進行調(diào)試,并通過CI/CD流水線進行部署。
Amazon Nova Act SDK還可與Amazon Bedrock AgentCore Browser Tool(一個快速、安全的云端瀏覽器)集成,支持AI Agent與網(wǎng)站進行大規(guī)模交互。它具備企業(yè)級安全能力,包括虛擬機級別隔離與聯(lián)合身份集成。該工具還通過實時查看、Amazon CloudTrail日志記錄和會話重放等提供內(nèi)置的可觀測性,以支持故障排查、質(zhì)量維護和合規(guī)性要求。
Amazon Nova Act SDK的優(yōu)勢
Amazon Nova Act SDK可靠性高、部署快速,專為安全、大規(guī)模瀏覽器自動化場景而構(gòu)建。
優(yōu)勢1——可靠性:構(gòu)建準確度高、可重復(fù)性強的瀏覽器自動化
借助Amazon Nova Act SDK,開發(fā)者可將復(fù)雜工作流拆解為可靠的原子命令(例如,收集網(wǎng)頁中的所有表單元素,并返回包含表單所有必填字段的字符串)。SDK支持添加詳細指令以根據(jù)需要優(yōu)化這些命令(例如,關(guān)閉彈窗橫幅),具備調(diào)用API的能力,并可選擇通過Playwright進行直接瀏覽器操作以提升執(zhí)行可靠性(例如,在輸入密碼時)。開發(fā)者可以在自動化流程中穿插使用Python代碼,例如編寫測試用例、設(shè)置流程中斷點或判斷條件,以及采用并發(fā)任務(wù)機制來提升執(zhí)行效率,特別是在網(wǎng)頁加載速度受限的情況下,這些方式能有效優(yōu)化整體性能。最新版Amazon Nova Act SDK在早期企業(yè)級應(yīng)用中已展現(xiàn)出超過90%的可靠性,涵蓋自動化質(zhì)檢、復(fù)雜表單處理和流程執(zhí)行等場景。推理能力與故障恢復(fù)機制的提升,使Agent能夠適應(yīng)不斷變化的用戶界面,持續(xù)穩(wěn)定地完成復(fù)雜操作序列。
優(yōu)勢2——上市速度:從原型到生產(chǎn)僅需數(shù)日,而非數(shù)周
Amazon Nova Act SDK專為加速自動化開發(fā)而設(shè)計,無需依賴脆弱的腳本邏輯??蛻艨赏ㄟ^一條命令完成SDK安裝,使用Python、自然語言或二者結(jié)合定義Agent,邊運行邊調(diào)試流程、檢查網(wǎng)頁的結(jié)構(gòu)化頁面元素(DOM)、設(shè)置步驟間的暫停點,并快速迭代優(yōu)化。該SDK支持以下功能:
客戶無需更改現(xiàn)有基礎(chǔ)設(shè)施或重構(gòu)內(nèi)部工具鏈,基于Amazon Nova Act構(gòu)建的agent可無縫融入當前開發(fā)流程,助力從試驗階段快速邁入生產(chǎn)環(huán)境。
優(yōu)勢3——安全性:依托亞馬遜云科技,部署值得信賴的自動化流程
Amazon Nova Act SDK集成了Amazon IAM實現(xiàn)訪問控制,模型訪問方式與其他亞馬遜云科技服務(wù)一致。該SDK支持在macOS、Linux、Windows和WSL2等系統(tǒng)上運行,運行時環(huán)境彼此隔離,輸入、輸出數(shù)據(jù)均支持加密處理。Amazon Nova Act SDK專為企業(yè)環(huán)境設(shè)計,具備生產(chǎn)系統(tǒng)所需的可靠性、可觀測性與安全性。
實際應(yīng)用展示:自動化信息采集,加速金融決策流程
在金融服務(wù)領(lǐng)域——特別是投資銀行、并購咨詢和戰(zhàn)略研究等場景中,成敗往往取決于團隊能多快、多準地將碎片化的公開數(shù)據(jù)轉(zhuǎn)化為可執(zhí)行的洞察。
Amazon Nova Act SDK應(yīng)用場景
當今企業(yè)中瀏覽器相關(guān)的業(yè)務(wù)流程極為常見,但許多仍依賴手動操作,重復(fù)性高且易出錯。Amazon Nova Act SDK幫助企業(yè)自動化這些任務(wù),使團隊能夠?qū)W⒂诟邇r值的工作,提升準確率,減少運營延遲。憑借其高可靠性,該SDK可適配多個行業(yè)與業(yè)務(wù)場景。
場景1——自動化數(shù)據(jù)錄入與表單填寫
Amazon Nova Act SDK通過自動化處理表單提交、文件上傳與數(shù)據(jù)更新,減少在基于Web的系統(tǒng)(如CRM、人力資源工具、財務(wù)平臺)中的重復(fù)人工輸入。在醫(yī)療場景中,工作人員需協(xié)助用戶完成各州差異化極大的福利申請流程;而公共部門的個案工作者也常需在多個系統(tǒng)中重復(fù)錄入家庭數(shù)據(jù)。Amazon Nova Act SDK能夠穩(wěn)定處理這些動態(tài)流程,可靠應(yīng)對字段變動、下拉菜單及彈窗,無需依賴脆弱腳本或定制代碼。
Rackspace Technology是一家混合架構(gòu)與AI解決方案服務(wù)商,正在與Alvee Health合作,利用Amazon Nova Act SDK實現(xiàn)公共福利成員的自動注冊。Alvee首席執(zhí)行官Nicole Cook表示:"許多公共項目的注冊表單又長又復(fù)雜,很多成員因此錯過本可獲得的幫助。通過Amazon Nova Act SDK,并結(jié)合Alvee系統(tǒng)中已有的信息,我們不僅簡化了繁瑣文書工作,更實現(xiàn)了對健康生活資源的及時、精準連接。我們預(yù)計該方案可使福利成功注冊率提升30%,整體個案處理能力提升多達10倍,幫助醫(yī)療服務(wù)提供者將更多精力投入患者關(guān)懷,而非行政事務(wù)。這正是AI技術(shù)助力公共福祉、提升社區(qū)健康水平的典型示例。"
場景2——為客戶支持賦能
在零售、旅游及SaaS等行業(yè),客戶支持團隊往往需要在內(nèi)部工具與第三方門戶之間頻繁切換,以完成服務(wù)工單。例如,零售員工可能需在合作方網(wǎng)站上提交退貨申請,旅行顧問可能需登錄航空公司后臺請求賠償,技術(shù)支持人員則可能需在客戶管理后臺重置授權(quán)碼。Amazon Nova Act SDK能夠自動執(zhí)行這些基于瀏覽器的操作,幫助agent專注于客戶對話的同時,后臺任務(wù)可高效、可靠地完成。
差旅與費用管理平臺Navan正在使用Amazon Nova Act SDK,通過自動化填寫不同供應(yīng)商的付款表單,簡化旅行顧問的操作流程。Navan產(chǎn)品高級副總裁Yuval Refua表示:"將Amazon Nova Act SDK集成進agent工作流程后,我們極大減少了重復(fù)性任務(wù),這是擴展運營規(guī)模、服務(wù)更多客戶的關(guān)鍵一步。我們也嘗試過其他自動化工具,但Amazon Nova Act在可靠性與靈活性上的表現(xiàn),使我們能用同一個腳本完成多個酒店品牌不同付款表單的填寫任務(wù)。目前我們正擴展該自動化覆蓋范圍,預(yù)期可進一步提升運營能力,更高效地滿足日益增長的客戶需求。"
場景3——自動化高風(fēng)險管理流程
資質(zhì)驗證、身份核查及其他高度依賴合規(guī)的任務(wù),常需在上百個界面結(jié)構(gòu)各異的第三方門戶中操作。Amazon Nova Act SDK使這些流程的自動化成為可能,兼具高準確率、靈活性與可控性,助力團隊在擴展規(guī)模的同時保持精準度。
全球Agent流程自動化(Agentic Process Automation, APA)領(lǐng)導(dǎo)者Automation Anywhere正通過Amazon Nova Act SDK拓展其自動化能力,率先開展專業(yè)資質(zhì)驗證這一高風(fēng)險、重復(fù)性強的關(guān)鍵任務(wù),該任務(wù)對于合規(guī)性、成員安全與日常運營至關(guān)重要。Automation Anywhere首席產(chǎn)品官Adi Kuruganti表示:"通過將Amazon Nova Act SDK深度集成進我們的流程推理引擎(Process Reasoning Engine,PRE),我們在企業(yè)自動化的‘計算執(zhí)行能力'方面實現(xiàn)了重大突破。我們的目標導(dǎo)向型AI agent不僅僅是點擊模擬器,而是能夠?qū)崟r理解并推理基于UI的流程,具備如同人類專家般的網(wǎng)站操作能力。這為此前難以實現(xiàn)的自動化場景打開了通路,例如醫(yī)療項目注冊測試等對準確性與可擴展性要求極高的任務(wù)。"
場景4——動態(tài)界面下的用戶體驗與質(zhì)量測試
在銀行、保險、政府等行業(yè),用戶體驗(UX)與質(zhì)量保證(QA)測試通常需要模擬用戶在動態(tài)網(wǎng)站上的真實操作。通過Amazon Nova Act SDK,團隊可以使用自然語言或Python編寫與更新測試用例,快速響應(yīng)UI變化,無需依賴脆弱的選擇器或頻繁手動改寫腳本。
Tyler Technologies是面向公共部門的一體化軟件與技術(shù)服務(wù)領(lǐng)先提供商,正在利用Amazon Nova Act SDK實現(xiàn)軟件測試自動化,提升版本發(fā)布的可靠性。Tyler Technologies數(shù)據(jù)與洞察部門總裁Franklin Williams表示:"Amazon Nova Act提供的自然語言接口讓我們能在數(shù)分鐘內(nèi)將原本的手動測試計劃轉(zhuǎn)化為自動化測試套件,無需編寫任何代碼,這不僅為我們節(jié)省了數(shù)百小時的工作量,也大幅擴展了測試覆蓋范圍并提升了產(chǎn)品質(zhì)量。目前我們正計劃在公司全產(chǎn)品線中進一步推廣Nova Act SDK的使用。"
Amazon Nova Act SDK的未來
亞馬遜云科技正與早期客戶密切合作,共同推動Amazon Nova Act SDK的發(fā)展路線圖。盡管當前聚焦于瀏覽器相關(guān)的工作流程,Amazon Nova Act SDK實際上是亞馬遜云科技打造"可在多種環(huán)境中穩(wěn)定運行的Agent"的更廣泛戰(zhàn)略組成部分。我們正持續(xù)將模型能力從Web拓展至更復(fù)雜的現(xiàn)實任務(wù)中,并將強化學(xué)習(xí)應(yīng)用于更多真實業(yè)務(wù)流程。同時,Amazon Nova Act SDK也在不斷深化與亞馬遜云科技生態(tài)的集成,幫助開發(fā)者更高效地從原型構(gòu)建邁向安全、可擴展的Agent系統(tǒng)部署。
立即開始使用Amazon Nova Act SDK
Amazon Nova Act SDK研究預(yù)覽版現(xiàn)已開放,技術(shù)負責(zé)人與開發(fā)者可前往Amazon Nova Act頁面獲取訪問權(quán)限,開始構(gòu)建原型。該SDK提供穩(wěn)定、逐步執(zhí)行的瀏覽器自動化工具,面向真實業(yè)務(wù)流程而非演示用途。
Amazon AGI Lab是亞馬遜的應(yīng)用研究團隊,致力于構(gòu)建能夠在數(shù)字與物理環(huán)境中執(zhí)行真實任務(wù)的AI agent;其研究方向涵蓋大語言模型(LLM)、強化學(xué)習(xí)、世界建模等多個領(lǐng)域。更多信息及最新技術(shù)進展可通過Amazon AGI Labs頁面獲取。