LambdaTest推出全球首個(gè)AI智能體測(cè)試平臺(tái)

LambdaTest

2025-08-20 19:46 4421

English
繁體中文
日本語(yǔ)
???
Malay
Thai

-LambdaTest推出全球首個(gè)AI智能體測(cè)試平臺(tái)：引入智能體對(duì)智能體測(cè)試

AI原生多智能體系統(tǒng)提供更智能、更快、更全面的軟件測(cè)試

舊金山2025年8月20日 /美通社/ -- 領(lǐng)先的AI原生測(cè)試平臺(tái)LambdaTest已推出其智能體對(duì)智能體測(cè)試（Agent-to-Agent Testing）平臺(tái)的封閉測(cè)試版。這是全球首個(gè)專為驗(yàn)證與評(píng)估AI智能體而設(shè)計(jì)的平臺(tái)。隨著AI智能體逐漸融入開發(fā)者的工作流程，該平臺(tái)將革新企業(yè)在對(duì)話流程、意圖識(shí)別、語(yǔ)氣一致性、復(fù)雜推理等多重維度中對(duì)AI智能體進(jìn)行測(cè)試與驗(yàn)證的方式。

隨著企業(yè)愈發(fā)依賴AI智能體來驅(qū)動(dòng)客戶體驗(yàn)，一個(gè)關(guān)鍵挑戰(zhàn)隨之浮現(xiàn)：目前尚無統(tǒng)一的標(biāo)準(zhǔn)來測(cè)試各類AI智能體。這些智能體與用戶和系統(tǒng)的交互具有動(dòng)態(tài)性和不可預(yù)測(cè)性，因此難以保證其可靠性與性能。當(dāng)被測(cè)系統(tǒng)本身不可預(yù)測(cè)時(shí)，傳統(tǒng)測(cè)試方法便力有未逮。

企業(yè)需要一種全新的、更智能的方法來大規(guī)模測(cè)試AI應(yīng)用，而智能體對(duì)智能體測(cè)試正是為此而生。 LambdaTest的智能體對(duì)智能體測(cè)試平臺(tái)，是業(yè)內(nèi)首創(chuàng)的同類解決方案。該平臺(tái)通過一套專業(yè)的AI測(cè)試智能體，對(duì)聊天及語(yǔ)音AI智能體進(jìn)行嚴(yán)格驗(yàn)證。

團(tuán)隊(duì)可上傳各種格式的現(xiàn)有需求文檔，如文本、圖像、音頻和視頻，系統(tǒng)會(huì)自動(dòng)進(jìn)行多模態(tài)分析，生成相關(guān)測(cè)試場(chǎng)景，從而模擬可能使被測(cè)AI智能體系失效的現(xiàn)實(shí)挑戰(zhàn)。每個(gè)測(cè)試場(chǎng)景都包含精確的驗(yàn)證標(biāo)準(zhǔn)和預(yù)期響應(yīng)，并在LambdaTest新一代測(cè)試編排云HyperExecute中進(jìn)行評(píng)估，其測(cè)試執(zhí)行速度相比標(biāo)準(zhǔn)自動(dòng)化網(wǎng)格最高可提升70%。

該平臺(tái)重點(diǎn)關(guān)注各類關(guān)鍵指標(biāo)，如偏見、完整性、幻覺等，以幫助團(tuán)隊(duì)評(píng)估AI智能體系的質(zhì)量

通過整合智能體AI和GenAI技術(shù)，它能夠生成真實(shí)世界場(chǎng)景，例如人格化智能體的語(yǔ)氣、數(shù)據(jù)隱私考量等，并以無與倫比的準(zhǔn)確性執(zhí)行測(cè)試用例。與傳統(tǒng)測(cè)試工具相比，這確保了更廣泛、更多樣的測(cè)試覆蓋范圍。與單智能體系統(tǒng)不同，LambdaTest的智能體對(duì)智能體測(cè)試采用了多個(gè)大語(yǔ)言模型（LLM），這些模型為智能體提供推理與測(cè)試生成能力。這種多智能體方法能夠生成更全面、更細(xì)致的測(cè)試套件，從而對(duì)AI應(yīng)用進(jìn)行更深入、更穩(wěn)健的測(cè)試。

“您部署的每個(gè)AI智能體都是獨(dú)一無二的，這既是其最大優(yōu)勢(shì)，也是其最大風(fēng)險(xiǎn)所在！隨著AI應(yīng)用變得越來越復(fù)雜，傳統(tǒng)測(cè)試方法根本無法跟上AI智能體的動(dòng)態(tài)特性?！盠ambdaTest首席執(zhí)行官兼聯(lián)合創(chuàng)始人Asad Khan表示， “我們的智能體對(duì)智能體測(cè)試平臺(tái)如同真實(shí)用戶般思考，能夠生成智能、具上下文感知的測(cè)試場(chǎng)景，模擬AI可能難以應(yīng)對(duì)的實(shí)際挑戰(zhàn)。每個(gè)測(cè)試都有明確的驗(yàn)證檢查點(diǎn)和我們期望看到的響應(yīng)?！?/p>

采用智能體對(duì)智能體測(cè)試的企業(yè)將實(shí)現(xiàn)更快速的測(cè)試創(chuàng)建、更高效的智能體評(píng)估、更短的測(cè)試周期，以及測(cè)試覆蓋率的顯著提升。多智能體系統(tǒng)可以使測(cè)試覆蓋范圍增加5至10倍，從而提供更全面的AI智能體性能視圖。

此外，與HyperExecute的集成使團(tuán)隊(duì)能夠快速獲得反饋，從而縮短測(cè)試與迭代之間的周期。通過對(duì)大部分測(cè)試過程的自動(dòng)化，企業(yè)還能降低對(duì)人工QA工作的依賴，從而實(shí)現(xiàn)顯著的成本節(jié)約。 LambdaTest智能體對(duì)智能體測(cè)試平臺(tái)配備15個(gè)專用AI測(cè)試智能體，涵蓋安全研究到合規(guī)性驗(yàn)證等不同角色，確保每一次部署都達(dá)到最大程度的穩(wěn)健性、安全性和可靠性。助力團(tuán)隊(duì)充滿信心地部署其AI智能體。

點(diǎn)擊此處，了解有關(guān)LambdaTest智能體對(duì)智能體測(cè)試的更多信息：https://www.lambdatest.com/agent-to-agent-testing

如需觀看該平臺(tái)的現(xiàn)場(chǎng)發(fā)布會(huì)，請(qǐng)參加2025年8月20日的Testμ大會(huì)：https://www.lambdatest.com/testmuconf-2025

消息來源：LambdaTest