Co je to agent v Langchain.js?

Agent je komponenta, kterÃ¡ spolupracuje s nÃ¡stroji a jazykovÃ½mi modely za ÃºÄelem provÃ¡dÄnÃ konkrÃ©tnÃch ÃºkolÅ¯ na zÃ¡kladÄ dotazu uÅ¾ivatele. PouÅ¾ÃvÃ¡ se createToolCallingAgent funkce pro spouÅ¡tÄnÃ nÃ¡strojÅ¯.

Jak vyÅeÅ¡Ãte chybu âparseResult on ToolCallingAgentOutputParserâ?

K tÃ©to chybÄ dochÃ¡zÃ, kdyÅ¾ je vÃ½stup agenta nekompatibilnÃ s analyzÃ¡torem. UjistÄte se, Å¾e vÃ½stup odpovÃdÃ¡ tomu, co analyzÃ¡tor oÄekÃ¡vÃ¡, a pouÅ¾ijte a ChatGeneration vÃ½stupnÃ formÃ¡t.

JakÃ½ je ÃºÄel AgentExecutor?

The AgentExecutor spravuje provÃ¡dÄnÃ agenta a jeho nÃ¡strojÅ¯, coÅ¾ vÃ¡m umoÅ¾Åuje spouÅ¡tÄt komplexnÃ pracovnÃ postupy v aplikacÃch Langchain.js.

Jak to dÄlÃ¡ ChatPromptTemplate prÃ¡ce?

ChatPromptTemplate organizuje chatovÃ© zprÃ¡vy ve strukturovanÃ©m formÃ¡tu, coÅ¾ umoÅ¾Åuje vloÅ¾enÃ dynamickÃ©ho obsahu, jako je historie chatu a zÃ¡pisnÃk agenta, do toku konverzace.

ProÄ je Zod pouÅ¾itÃ½ v nÃ¡stroji?

Zod se pouÅ¾ÃvÃ¡ pro ovÄÅenÃ vstupu, coÅ¾ zajiÅ¡Å¥uje, Å¾e vstup do vlastnÃho nÃ¡stroje je sprÃ¡vnÃ©ho typu (napÅ. ÄÃslo), coÅ¾ sniÅ¾uje pravdÄpodobnost chyb.

RozpracovÃ¡vÃ¡ oficiÃ¡lnÃ dokumentaci Langchain, kterÃ¡ poskytuje pohled na vytvÃ¡ÅenÃ nÃ¡strojÅ¯ a konfiguraci agentÅ¯. Dokumentace Langchain UvnitÅ.

DÃ¡le vysvÄtluje pouÅ¾itÃ Zodu pro validaci vstupu a jeho aplikaci v Langchain.js. Dokumentace Zod UvnitÅ.

Oprava chyby ToolCallingAgentOutputParser Langchain.js

Daniel Marino

Pátek 1. listopadu 2024 19:30:36

Pochopení a oprava chyb ToolCallingAgentOutputParser v Langchain.js

Při práci s Langchain.js v2 se vývojáři často snaží vytvořit efektivní agenty pomocí vlastních nástrojů a jazykových modelů, jako je Ollama. Integrace těchto součástí však může někdy vést k chybám, které se obtížně ladí.

Jednou z takových chyb je „parseResult on ToolCallingAgentOutputParser funguje pouze na výstupu ChatGeneration“, ke které může dojít při vytváření vlastního nástroje v rámci agenta. Pochopení hlavní příčiny tohoto problému je zásadní pro zajištění správného fungování agenta a nástroje.

Tento článek zkoumá jednoduchou implementaci vlastního nástroje, který přidává 2 k číselnému vstupu, pomocí createToolCallingAgent společnosti Langchain a modelu Ollama. Analýzou chyby a jejího kontextu můžeme lépe pochopit, jak ji odstranit.

Následující části vás provedou kódem, vysvětlí chybu a poskytnou řešení tohoto problému. Ať už jste v Langchain.js noví nebo zkušení, tento průvodce vám pomůže tento problém efektivně překonat.

Příkaz	Příklad použití
tool()	Tato funkce z Langchain.js definuje vlastní nástroj, který provádí operaci. V tomto článku se používá k vytvoření nástroje, který ke vstupnímu číslu přidá 2 a zabalí logiku do snadno vyvolatelné struktury.
z.object()	Část knihovny Zod, která se používá pro ověřování schémat v Langchainu. Tím je zajištěno, že vstupem do vlastního nástroje je číslo, což poskytuje silné ověření vstupu, aby se zabránilo chybám během provádění.
createToolCallingAgent()	Tento příkaz vytvoří agenta, který může volat definované nástroje jako odpověď na uživatelské dotazy. Je to klíčové pro integraci nástrojů s jazykovými modely, jako je Ollama, což umožňuje vyvolat nástroje během konverzace.
ChatPromptTemplate.fromMessages()	Používá se ke generování šablony výzvy k chatu se zástupnými symboly. Tato šablona organizuje různé typy zpráv (systémové, lidské, zástupné symboly), které může agent použít, a zlepšuje tak jeho konverzační tok.
MessagesPlaceholder	Funguje jako zástupný symbol v šabloně výzvy pro dynamický obsah, jako je historie chatu nebo zápisník agenta. To umožňuje dynamické vkládání kontextu konverzace během provádění.
AgentExecutor()	Tato třída spravuje provádění agentů a nástrojů. V příkladu to pomáhá při spuštění dotazu prostřednictvím agenta a shromažďování výsledku z výstupu nástroje.
await agentExecutor.invoke()	Používá se ke spuštění dotazu prostřednictvím agenta a asynchronnímu čekání na výsledek. To je zásadní pro interakci s jazykovými modely a nástroji, protože to zajišťuje, že kód čeká na dokončení operace, než se přesune dál.
try-catch	Tato struktura zpracování chyb se používá v rámci vlastního nástroje k zachycení neplatných typů vstupů. Zachycováním výjimek zajišťuje, že systém vrací užitečné chybové zprávy, aniž by narušil tok provádění.
expect()	Z knihovny asercí Chai se v testu jednotek k ověření výstupu vlastního nástroje používá expect() . Je to nezbytné pro testování, zda nástroj funguje podle očekávání.

Pochopení Custom Tool a Agent Error Handling v Langchain.js

V uvedeném příkladu pracujeme s Langchain.js v2 na vytvoření vlastního nástroje, který se integruje s Ollama jazykový model. Hlavním účelem nástroje je provést jednoduchou matematickou operaci: přičtení 2 ke vstupní hodnotě. Nástroj je vytvořen pomocí Langchain's nástroj funkce, která definuje opakovaně použitelné funkce, které může agent vyvolat. Aby bylo zajištěno správné fungování nástroje, je vstupní schéma ověřeno pomocí knihovny Zod, což zaručuje, že vstup je platným číslem. To zajišťuje správné zpracování chyb a zabraňuje selhání nástroje kvůli neplatným vstupům.

Vlastní nástroj je pak začleněn do agenta pomocí createToolCallingAgent funkce. Tento příkaz umožňuje agentovi zavolat nástroj v případě potřeby a agent je poháněn modelem Ollama, který je nakonfigurován se specifickými parametry, jako je teplota, pro řízení kreativity odpovědí. Pro usnadnění hladké interakce mezi agentem a nástrojem se používá šablona výzvy k chatu. Tato šablona organizuje konverzaci definováním různých typů zpráv, jako jsou systémové zprávy, lidské vstupy a zástupné symboly. Zástupné symboly, jako např Zástupný symbol zpráv, umožňují konverzaci, aby byla dynamická a obsahovala prvky, jako je historie chatu.

Jedním z klíčových problémů řešených v tomto příkladu je zpracování chyb při analýze výstupu agenta Langchain. Chybová zpráva "parseResult na ToolCallingAgentOutputParser funguje pouze na výstupu ChatGeneration" pochází z nesouladu mezi typem výstupu očekávaným analyzátorem a skutečným výstupem generovaným. Aby bylo možné tuto chybu zvládnout, je vlastní nástroj zabalen do robustní logiky, která zajišťuje, že všechny vstupy a výstupy odpovídají očekávaným formátům. Toto je dále řízeno AgentExecutor třída, která koordinuje provádění agenta a nástrojů a zajišťuje, že výstup dotazu a nástroje jsou správně synchronizovány.

Nakonec skripty implementují asynchronní provádění pomocí čekat, což umožňuje systému zpracovávat operace bez blokování jiných procesů. Agent před pokračováním čeká, až nástroj vrátí výsledek, čímž zajistí, že odpověď bude přesná a včasná. Kromě toho jsou zahrnuty testy jednotek, které ověřují funkčnost nástroje a zajišťují, že konzistentně produkuje správný výstup. Tyto testy nejen potvrzují matematické fungování nástroje, ale také ověřují, jak dobře zpracovává neplatný vstup, čímž zlepšuje celkovou spolehlivost řešení. Díky tomuto modulárnímu a chybám odolnému designu jsou skripty opakovaně použitelné a efektivní pro různé aplikace v rámci Langchain.js.

Oprava chyby Langchain.js pomocí modulárního přístupu

Řešení 1: JavaScript s modulárním přístupem a zpracováním chyb pomocí Langchain.js a Ollama LLM

import { tool } from "@langchain/core/tools";
import { z } from "zod";
import { Ollama } from "@langchain/ollama";
import { ChatPromptTemplate } from "@langchain/core/prompts";
import { createToolCallingAgent } from "langchain/agents";
import { AgentExecutor } from "langchain/agents";
// Initialize LLM with Ollama
const llm = new Ollama({
    model: "llama3",
    temperature: 0.7,
});
// Custom tool to add 2 to the input number
const magicTool = tool(
    async (input) => {
        return input + 2;
    },
    {
        name: "magic_function",
        description: "Applies a magic function to an input",
        schema: z.object({ input: z.number() }),
    };
);
const tools = [magicTool];
// Setup ChatPromptTemplate with placeholders
const prompt = ChatPromptTemplate.fromMessages([
    ["system", "You are a helpful assistant called iHelp"],
    ["placeholder", "{chat_history}"],
    ["human", "{input}"],
    ["placeholder", "{agent_scratchpad}"],
]);
// Agent configuration
const agent = createToolCallingAgent({ llm, tools, prompt });
// Execute agent query
const agentExecutor = new AgentExecutor({ agent, tools });
const query = "What is the value of magic_function(3)?";
await agentExecutor.invoke({ input: query });

Vylepšené zpracování chyb pro agenta Langchain.js

Řešení 2: Zpracování chyb s testy jednotek pro ověření výstupu vlastního nástroje v Langchain.js

import { tool } from "@langchain/core/tools";
import { z } from "zod";
import { Ollama } from "@langchain/ollama";
import { createToolCallingAgent } from "langchain/agents";
import { AgentExecutor } from "langchain/agents";
// Initialize LLM with Ollama
const llm = new Ollama({ model: "llama3", temperature: 0.7 });
// Custom tool with added error handling
const magicTool = tool(
    async (input) => {
        try {
            if (typeof input !== "number") throw new Error("Invalid input type!");
            return input + 2;
        } catch (err) {
            return err.message;
        }
    },
    {
        name: "magic_function",
        description: "Adds 2 to input and handles errors",
        schema: z.object({ input: z.number() }),
    }
);
const tools = [magicTool];
// Agent and execution
const agent = createToolCallingAgent({ llm, tools });
const agentExecutor = new AgentExecutor({ agent, tools });
const query = "magic_function('abc')"; // Test with invalid input
await agentExecutor.invoke({ input: query });
// Unit test example
import { expect } from "chai";
it("should return 5 when input is 3", async () => {
    const result = await magicTool(3);
    expect(result).to.equal(5);
});

Prozkoumání role agentů v integraci Langchain.js a Ollama LLM

Při práci s Langchain.js integrace agenti s nástroji a jazykovými modely, jako je Ollama, je kritickým aspektem vytváření dynamických aplikací. Agent vám umožňuje připojit vlastní nástroj, který provádí specifické úkoly, k jazykovému modelu, který zpracovává konverzační nebo generativní úkoly. Pomocí agentů mohou vývojáři automatizovat pracovní postupy, kdy model nejen generuje odpovědi, ale také vyvolává nástroje pro provádění výpočtů nebo zpracování dat.

Klíčovou součástí této integrace je createToolCallingAgent funkce. Tato funkce umožňuje agentovi v případě potřeby spouštět specifické nástroje, což zajišťuje přesné a efektivní dokončení úkolů. Zatímco primární důraz je často kladen na vytvoření samotného nástroje, pochopení toho, jak spravovat pracovní postup agenta a vyhnout se chybám při analýze, je stejně důležité. Chyby jako „parseResult on ToolCallingAgentOutputParser funguje pouze na výstupu ChatGeneration“ se obvykle vyskytují, když výstup agenta není kompatibilní se systémem analýzy, což zdůrazňuje potřebu správného zarovnání mezi výstupem agenta a očekávaným formátem.

Použití šablon výzvy, jako je např ChatPromptTemplatedále obohacuje interakci tím, že umožňuje dynamické zprávy a zástupné symboly kontextu. To agentovi umožňuje upravit své odpovědi na základě historie chatu nebo zápisníku agenta. Optimalizace šablon výzvy a zajištění správné analýzy výstupů agenta může zabránit mnoha běžným chybám, díky čemuž budou vaše aplikace Langchain.js spolehlivější a efektivnější.

Často kladené otázky o Langchain.js, agentech a nástrojích

Co je to agent v Langchain.js?
Agent je komponenta, která spolupracuje s nástroji a jazykovými modely za účelem provádění konkrétních úkolů na základě dotazu uživatele. Používá se createToolCallingAgent funkce pro spouštění nástrojů.
Jak vyřešíte chybu „parseResult on ToolCallingAgentOutputParser“?
K této chybě dochází, když je výstup agenta nekompatibilní s analyzátorem. Ujistěte se, že výstup odpovídá tomu, co analyzátor očekává, a použijte a ChatGeneration výstupní formát.
Jaký je účel AgentExecutor?
The AgentExecutor spravuje provádění agenta a jeho nástrojů, což vám umožňuje spouštět komplexní pracovní postupy v aplikacích Langchain.js.
Jak to dělá ChatPromptTemplate práce?
ChatPromptTemplate organizuje chatové zprávy ve strukturovaném formátu, což umožňuje vložení dynamického obsahu, jako je historie chatu a zápisník agenta, do toku konverzace.
Proč je Zod použitý v nástroji?
Zod se používá pro ověření vstupu, což zajišťuje, že vstup do vlastního nástroje je správného typu (např. číslo), což snižuje pravděpodobnost chyb.

Závěrečné úvahy o zpracování chyb v Langchain.js

Řešení chyby „parseResult on ToolCallingAgentOutputParser funguje pouze na výstupu ChatGeneration“ vyžaduje pečlivé zarovnání mezi výstupem vašeho agenta a jeho očekáváním analýzy. Správným přístupem se lze této chybě vyhnout.

Použitím vhodných nástrojů, jako je Zod, pro ověřování a zajištěním toho, že agenti, jako jsou ti, kteří jsou vytvořeni pomocí Ollama, zpracovávají vstupy a výstupy správně, můžete vytvářet robustní řešení v Langchain.js, aniž byste narazili na problémy s analýzou.

Zdroje a odkazy pro řešení chyb Langchain.js

Rozpracovává oficiální dokumentaci Langchain, která poskytuje pohled na vytváření nástrojů a konfiguraci agentů. Dokumentace Langchain Uvnitř.
Dále vysvětluje použití Zodu pro validaci vstupu a jeho aplikaci v Langchain.js. Dokumentace Zod Uvnitř.
Popisuje jazykový model Ollama a jeho implementaci v rámci vlastních agentů. Ollama LLM Uvnitř.

Oprava chyby ToolCallingAgentOutputParser Langchain.js pomocí Ollama LLM a vlastního nástroje