Chatbot mit Wissen

Allgemeiner Überblick

Wir freuen uns, ein kürzlich abgeschlossenes Projekt für Marketingwerk vorzustellen, eine Marketingagentur, die für innovative Ansätze sehr offen ist. Wie viele Unternehmen stand Marketingwerk vor der Herausforderung, Informationen effizient aus einer Vielzahl interner Dokumente abzurufen. Das manuelle Durchsuchen von Dateien war mühsam und oft frustrierend für das Team.

Um dieses Problem zu lösen, haben wir einen maßgeschneiderten Chatbot entwickelt, der es den Mitarbeitern ermöglicht, auf natürliche Weise mit ihren internen Dokumenten zu interagieren. Anstatt wertvolle Zeit mit der Suche durch Ordner und Dateien zu verbringen, können Teammitglieder nun einfach dem Chatbot Fragen stellen und erhalten sofort relevante Antworten.

Warum ist das wichtig?

  • Effizienz: Spart Zeit durch schnelle Bereitstellung von Informationen.
  • Produktivität: Ermöglicht es den Mitarbeitern, sich auf ihre Kernaufgaben zu konzentrieren, ohne unnötige Unterbrechungen.
  • Zugänglichkeit: Macht internes Wissen für alle Teammitglieder leicht verfügbar.

Technische Umsetzung

Um sicherzustellen, dass der Chatbot präzise und kontextrelevante Antworten liefert, haben wir Retrieval Augmented Generation (RAG) implementiert. RAG kombiniert die Stärken von Informationsabruf und generativer KI, indem es relevante Daten aus den internen Dokumenten abruft und diese zur Beantwortung von Benutzeranfragen nutzt. So liefert der Chatbot nicht nur vorgefertigte Antworten, sondern generiert Einblicke basierend auf dem tatsächlichen Inhalt der Dokumente von Marketingwerk.

Um die Vielzahl unterschiedlicher Dokumentformate zu bewältigen, haben wir die Bibliothek von Unstructured.io verwendet. Diese leistungsstarke Open-Source-Toolchain ermöglicht die Extraktion und Verarbeitung unstrukturierter Daten aus verschiedenen Dateiformaten wie PDFs, Word-Dokumenten, E-Mails und mehr. Dadurch wird sichergestellt, dass alle Informationen unabhängig vom ursprünglichen Format zugänglich und durchsuchbar sind.

Wir haben Milvus eingesetzt, eine Open-Source-Vektordatenbank, die für skalierbare Ähnlichkeitssuchen optimiert ist. Milvus speichert die Vektoreinbettungen der Dokumente, was es dem System ermöglicht, schnell und effizient relevante Informationen basierend auf den Benutzeranfragen zu finden. Dies verbessert die Geschwindigkeit und Genauigkeit der Chatbot-Antworten erheblich.

Wir haben die Leistungsfähigkeit von GPT-4o, einem fortschrittlichen Sprachmodell von OpenAI, genutzt. GPT-4o zeichnet sich durch sein Verständnis und die Generierung von Texten auf menschlichem Niveau aus, was es ideal für die Schaffung einer natürlichen und intuitiven Konversationsschnittstelle macht.

Für die Entwicklung einer interaktiven und benutzerfreundlichen Oberfläche haben wir Streamlit genutzt. Streamlit ermöglicht die schnelle Erstellung von Webanwendungen und bietet ein sauberes, intuitives Benutzererlebnis. Die Mitarbeiter können so problemlos mit dem Chatbot interagieren, ohne umfangreiche Schulungen oder technische Kenntnisse zu benötigen.

Nach oben scrollen