Descripción del producto ※Tenga en cuenta que la información del producto está traducida por máquina, por lo que puede que no sea la traducción correcta.
Ciencia de la información
[Introducción]
[Características del libro]
Este libro explica el análisis bayesiano y, por lo tanto, el modelo temático, tanto desde la teoría como desde la práctica.
Un modelo de tema es una técnica propuesta para el procesamiento de lenguaje natural, un modelo estocástico que puede descubrir temas latentes y profundos a partir de grandes cantidades de datos de documentos.
En los últimos años, su poder se ha extendido más allá de los datos de documentos para analizar imágenes y datos de trayectoria, y se ha convertido en la base de la inteligencia artificial (IA) junto con la aprendizaje profundo.
En este libro, tratamos de aprender de manera práctica mientras creamos programas en la medida de lo posible, al tiempo que abordamos con firmeza los fundamentos teóricos.
Además, hemos creado una escalera baja para que los lectores puedan subir fácilmente.
[Acerca de cada capítulo]
Capítulo 1 : Explicar el conocimiento de las probabilidades y las distribuciones de probabilidad necesarias para aprender este libro y la implementación del programa.
Capítulo 2 : Revisión de las técnicas básicas tradicionales de análisis de datos para posicionar el contraste.
Capítulo 3 : Explicar los conceptos básicos del análisis bayesiano.
También introduce el uso de la biblioteca PyMC, que se utiliza para realizar programas de análisis bayesiano.
Capítulo 4 : Revisión de las técnicas básicas tradicionales de análisis de datos de documentos para posicionar el contraste.
Capítulo 5 : Configurar un modelo de Unigram para analizar los datos del documento.
La biblioteca de PyMC también muestra la implementación del programa.
Capítulo 6 : Incorporar la idea de un tema para construir un modelo de unigrama mixto.
Además, se muestra un ejemplo de programa de análisis de documentos utilizando un modelo de unigram mixto.
Capítulo 7 : Desarrollar aún más el modelo de unigrama mixto para construir un modelo temático.
Además, se muestra un ejemplo de programa de análisis de documentos utilizando un modelo de tema.
Capítulo 8 : Aprenda a utilizar el módulo de modelos temáticos de la biblioteca de aprendizaje de Scikit.
Utilícelo para extraer temas de los datos de documentos en inglés en el conjunto de datos de 20 grupos de noticias.
Capítulo 9 : Cómo utilizar una biblioteca dedicada al modelo temático de Gensim.
Lo utiliza para extraer temas de los datos de documentos スペイン語 de Wikipedia.
Capítulo 10 : Ampliación del modelo de tema para configurar el modelo de tema del autor.
A continuación, utiliza la biblioteca Gensim para extraer temas de los datos de los puestos de スペイン語 recopilados de Twitter.
Capítulo 11 : Aplicación de modelos temáticos a conjuntos de datos de imágenes.
La biblioteca de Gensim se utiliza para extraer temas de un conjunto de datos llamado Caltech101, representados por pequeñas celdas divididas.
Capítulo 12 : Aplicación de modelos temáticos a conjuntos de datos de trayectoria.
Utilice la biblioteca de Gensim para extraer temas de los datos de AIS de los buques que podrían convertirse en cursos.
[Mensaje del autor]
La práctica es un atajo para la adquisición de habilidades.
Al leer este libro, tenga en cuenta que debe hacerlo repetidamente.
Además, es más eficaz si se puede abordar para resolver los problemas que se esperan en situaciones de aplicación práctica.
Esperamos que los lectores de este documento mejoren sus habilidades avanzadas de análisis de datos y participen en la práctica.
Probabilidad y distribución
1.1 Probabilidad y distribución
1.1.1 Probabilidad
1.1.2 Probabilidad
1.2 Condición y coincidencia
1.2.1 Condición y coincidencia
1.3 Teorema de multiplicación y Teorema de Bayes
1.4 Varias distribuciones de probabilidad
1.4.1 Distribución de Bernoulli
1.4.2 Distribución binomial
1.4.3 Categoría
1.4.5 Distribución exponencial
1.4.6 Distribución beta
1.4.7 Distribución gamma
1.4.8 Dirichlet
1.5 Módulo estadístico de estadísticas de Scipy estadísticas
1.6 Programa con Python para varias distribuciones de probabilidad
2. Ejemplo de programa para calcular la similitud del coseno
Problema de ejercicio
5. Modelo de unigrama
Modelo estocástico para la generación de documentos
Representación de modelo gráfico
Modelo de unigrama
Programa para generar un conjunto de documentos basado en el modelo de unigrama
Programa para generar un conjunto de documentos basado en el modelo de unigram
Programa para estimar la frecuencia de aparición de palabras en el conjunto de documentos
Análisis de datos y modelo
Estimación de parámetros del modelo de unigram
Análisis de datos y modelo
Estimación de parámetros del modelo de unigram
Análisis de datos y modelo
Estimación de parámetros del modelo de unigram
2.1 2.2 2.2.1 2.2.2 2.3 2.4 3.1 3.2 3.3 3.4 3.4.1 3.4.2 3.5 3.5.1 3.5.2 4.1 4.2 4.3 4.3.1 4.3.2 4.3.3 4.3.4 4.4 4.4.1 4.4.2 4.4.3 5.1 5.2 5.3 5.3.1 5.3.2 5.3.3 5.4 5.4.1 5.4.2 5.4.3 6.1 6.2 6.3 6.4 1.2.2 7.1 7.2 7.3 7.4 7.4.1 7.4.2 8.1 8.2 8.3 8.4 8.5 8.6 9.1 9.2 9.3 9.4 10.1 10.2 10.2.1 10.2.2 1.3.1 10.3 10.3.1 10.3.2 10.3.3 11.1 11.1.1 11.1.2 11.1.3 11.2 11.3 1.3.2 11.4 12.1 12.1.1 12.1.2 12.1.3 12.2 12.3 12.4 TFIDF PyMC PyMC PyMC TFIDF Gensim PyMC Scikit Scikit PyMC Arviz Scikit Gensim PyMC TFIDF Gensim PyMC PyMC MeCab Gensim PyMC Scikit