Saltar al contenido principal

Generación de vectores

La generación de vectores necesita ser utilizada junto con el almacenamiento, lo que significa que debe configurar el almacenamiento antes de entender los vectores.

Los vectores son en realidad el resultado de la incrustación (embedding), que es el proceso de convertir varios tipos de datos (como texto e imágenes) en representaciones vectoriales densas. Este paso es crucial para el procesamiento y análisis eficiente de datos en Casibase. A través de la incrustación, las preguntas en los chats y los archivos de conocimiento en el almacenamiento se convertirán en vectores, que se utilizarán en el siguiente paso de búsqueda de conocimiento.

1. Actualización de vectores

La operación de actualización de vectores se establece como un botón para cada almacenamiento de datos en el menú de almacenamiento. En el almacenamiento, ya que configuraremos un proveedor de almacenamiento, nos proporcionará un árbol de archivos para almacenar archivos de usuario, por lo que después de configurar el almacenamiento, guardar la configuración y volver a la página principal, verá el árbol de archivos del proveedor de almacenamiento.

Al hacer clic en el botón de actualización de vectores para un almacenamiento específico, generará los vectores correspondientes para todos los archivos en el árbol de archivos de ese almacenamiento mediante la incrustación. A continuación se muestra la página y la operación.

refreshVectors.png

2. Visualización de vectores

Después de esto, podemos ver los vectores específicos generados para ese almacenamiento en el menú de vectores.

vectors.png

Podemos ver que los archivos de almacenamiento del paso anterior de actualización de vectores se han convertido en vectores que se muestran aquí.

img.png

Mi página de edición de vectores muestra información específica como el nombre del almacenamiento, el nombre del modelo de incrustación, el nombre del archivo que se ha incrustado, el tamaño del archivo, la dimensión, los datos vectoriales, etc.