11:[["$","$L124",null,{"props":{"lessonContent":{"components":[{"type":"SlateHTML","content":{"html":"

Now that we've seen how to fine-tune the BERT model for abstractive and extractive summarization tasks, let's see how to train the BERTSUM model.

The code for training the BERTSUM model is open-source and available on GitHub. ...

","comp_id":"QQY-QufVcn5zY91Ba-Dzq"},"hash":0,"iteration":0}],"summary":{"title":"Training the BERTSUM Model","titleUpdated":true,"description":"Learn how to train the BERTSUM model on the CNN/DailyMail news dataset."},"content":[{"type":"SlateHTML","content":{"html":"

Now that we've seen how to fine-tune the BERT model for abstractive and extractive summarization tasks, let's see how to train the BERTSUM model.

The code for training the BERTSUM model is open-source and available on GitHub. ...

","comp_id":"QQY-QufVcn5zY91Ba-Dzq"},"hash":0,"iteration":0}],"darkModeContent":[{"type":"SlateHTML","content":{"html":"

Now that we've seen how to fine-tune the BERT model for abstractive and extractive summarization tasks, let's see how to train the BERTSUM model.

The code for training the BERTSUM model is open-source and available on GitHub. ...

","comp_id":"QQY-QufVcn5zY91Ba-Dzq"},"hash":0,"iteration":0}]},"isPreviewLesson":false,"pageType":"collection_lesson","aiCoachVideoUrl":"https://youtu.be/kgl8y9J3O6c","collectionDetailsSSR":{"title":"Getting Started with Google BERT","summary":"This comprehensive course dives into Google’s BERT architecture, exploring its revolutionary role in natural language processing (NLP). Starting with BERT’s architecture and pre-training methods, you’ll uncover the mechanics of transformers, including encoder-decoder components and self-attention mechanisms. Gain hands-on experience fine-tuning BERT for NLP tasks like sentiment analysis, question-answering, and named entity recognition.\n\nDiscover BERT variants such as ALBERT, RoBERTa, and DistilBERT alongside domain-specific adaptations like ClinicalBERT and BioBERT. Explore applications in text summarization, multilingual tasks, and advanced models like VideoBERT and BART. With practical coding exercises and quizzes, you’ll master embeddings, tokenization, and BERT libraries, equipping you to build cutting-edge NLP solutions.\n\nWhether you’re new to Google BERT or enhancing your expertise, this course is your guide to state-of-the-art NLP innovations.","details":"","clos":["An understanding of Google BERT’s architecture, pre-training tasks (MLM, NSP), and transformer fundamentals like self-attention and multi-head attention","The ability to apply and fine-tune pretrained BERT models for NLP tasks such as sentiment analysis, NER, question answering, and domain-specific applications","Familiarity with BERT variants (ALBERT, RoBERTa, ELECTRA) and lightweight models using knowledge distillation (DistilBERT, TinyBERT)","The ability to utilize advanced BERT applications, including text summarization (BERTSUM), multilingual models (M-BERT), and multimodal tools like VideoBERT","The ability to build real-world projects using BERT libraries like Hugging Face Transformers and apply domain-specific models like BioBERT and FinBERT"],"arabic_available":false,"toc":{"categories":[{"id":"f72ucc9ti","title":"Before We Start","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":5352220988801024,"id":5352220988801024,"title":"About the Course","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"about-the-course"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Get familiar with Google's BERT architecture for NLP tasks and fine-tuning methods."},{"id":"26hl1jyry","title":"Starting Off with BERT","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":5054422676406272,"id":5054422676406272,"title":"Introduction: BERT","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"introduction-bert"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Look at BERT’s architecture, pre-training tasks, and applications in NLP tasks."},{"id":"mi331b8ak","title":"A Primer on Transformers","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":4742829753761792,"id":4742829753761792,"title":"Introduction to the Transformer","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"introduction-to-the-transformer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6057006397128704,"id":6057006397128704,"title":"Understanding the Encoder of the Transformer","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"understanding-the-encoder-of-the-transformer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6499551304482816,"id":6499551304482816,"title":"Self-Attention Mechanism","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"self-attention-mechanism"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4509778905923584,"id":4509778905923584,"title":"Understanding the Self-Attention Mechanism","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"understanding-the-self-attention-mechanism"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5876354502623232,"id":5876354502623232,"title":"Multi-Head Attention Mechanism","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"multi-head-attention-mechanism"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4698798382383104,"id":4698798382383104,"title":"Learning Position with Positional Encoding","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"learning-position-with-positional-encoding"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5464204206407680,"id":5464204206407680,"title":"Encoder: Feedforward and Add and Norm Component","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"encoder-feedforward-and-add-and-norm-component"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5246546387140608,"id":5246546387140608,"title":"Putting All the Encoder Components Together","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"putting-all-the-encoder-components-together"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5762202140409856,"id":5762202140409856,"title":"Understanding the Decoder of the Transformer","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"understanding-the-decoder-of-the-transformer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5154145953906688,"id":5154145953906688,"title":"Masked Multi-Head Attention","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"masked-multi-head-attention"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6635805836836864,"id":6635805836836864,"title":"Multi-Head Attention","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"multi-head-attention"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5850605385154560,"id":5850605385154560,"title":"Decoder: Feedforward and Add and Norm Component","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"decoder-feedforward-and-add-and-norm-component"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5761371903098880,"id":5761371903098880,"title":"Putting All the Decoder Components Together","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"putting-all-the-decoder-components-together"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5672614944309248,"id":5672614944309248,"title":"Putting the Encoder and Decoder Together","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"putting-the-encoder-and-decoder-together"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6464994215723008,"id":6464994215723008,"title":"Summary: A Primer on Transformers","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"summary-a-primer-on-transformers"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6714643581239296,"id":6714643581239296,"title":"Exercise: A Primer on Transformers","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"exercise-a-primer-on-transformers"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6062561278820352,"id":6062561278820352,"title":"Exercise: Decoder Architecture","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"exercise-decoder-architecture"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5340244668055552,"id":5340244668055552,"title":"Quiz: A Primer on Transformers","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"quiz-a-primer-on-transformers"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Work your way through the transformer architecture, including encoder-decoder components and self-attention mechanisms."},{"id":"p12qe2on0","title":"Understanding the BERT Model","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":4541267806781440,"id":4541267806781440,"title":"Introduction to the BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"introduction-to-the-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6701391946186752,"id":6701391946186752,"title":"Working of BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"working-of-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5568493412679680,"id":5568493412679680,"title":"Configurations of BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"configurations-of-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5592027998978048,"id":5592027998978048,"title":"Pre-Training the BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"pre-training-the-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5429274441154560,"id":5429274441154560,"title":"The WordPiece Tokenizer","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"the-wordpiece-tokenizer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4820899526868992,"id":4820899526868992,"title":"Pre-Training Strategies for the BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"pre-training-strategies-for-the-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5739524943773696,"id":5739524943773696,"title":"Masked Language Modeling","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"masked-language-modeling"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4570339635101696,"id":4570339635101696,"title":"Next Sentence Prediction","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"next-sentence-prediction"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6189015350116352,"id":6189015350116352,"title":"Pre-Training Procedure","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"pre-training-procedure"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5704766545199104,"id":5704766545199104,"title":"Subword Tokenization Algorithms","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"subword-tokenization-algorithms"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5140522162454528,"id":5140522162454528,"title":"Byte Pair Encoding","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"byte-pair-encoding"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4648084985610240,"id":4648084985610240,"title":"Byte-Level Byte Pair Encoding and WordPiece Algorithms","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"byte-level-byte-pair-encoding-and-wordpiece-algorithms"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6219539833683968,"id":6219539833683968,"title":"Summary: Understanding the BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"summary-understanding-the-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6599140191764480,"id":6599140191764480,"title":"Quiz: Understanding the BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"quiz-understanding-the-bert-model"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Grasp the fundamentals of the BERT model's architecture, training, and tokenization methods."},{"id":"ap9jlydjh","title":"Getting Hands-On with BERT","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":4971850433298432,"id":4971850433298432,"title":"Exploring the Pre-Trained BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"exploring-the-pre-trained-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5050864124559360,"id":5050864124559360,"title":"Transformers","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"transformers"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6431731392708608,"id":6431731392708608,"title":"Extracting Embeddings From All Encoder Layers of BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"extracting-embeddings-from-all-encoder-layers-of-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4685888893485056,"id":4685888893485056,"title":"Fine-Tuning BERT for Downstream Tasks","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"fine-tuning-bert-for-downstream-tasks"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6456371202228224,"id":6456371202228224,"title":"Sentiment Analysis","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"sentiment-analysis"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5720098244657152,"id":5720098244657152,"title":"Natural Language Inference","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"natural-language-inference"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5966695385792512,"id":5966695385792512,"title":"Question-Answering","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"question-answering"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5897824243023872,"id":5897824243023872,"title":"Performing Question-Answering with the Fine-Tuned BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"performing-question-answering-with-the-fine-tuned-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5014647181934592,"id":5014647181934592,"title":"Named Entity Recognition","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"named-entity-recognition"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5097239084269568,"id":5097239084269568,"title":"Summary: Getting Hands-On with BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","brief_summary":"","slug":"summary-getting-hands-on-with-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5626058284728320,"id":5626058284728320,"title":"Quiz: Getting Hands-On with BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-getting-hands-on-with-bert"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Solve problems in applying pre-trained BERT for various NLP tasks using embeddings."},{"id":"0113ofqyd","title":"Exploring BERT Variants","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":6143068515074048,"id":6143068515074048,"title":"Introducion: BERT Variants","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"introducion-bert-variants"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Focus on notable BERT variants and their architectural enhancements for efficient performance."},{"id":"iq8j7e483","title":"Different BERT Variants","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":6549758613913600,"id":6549758613913600,"title":"ALBERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"albert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5381897883222016,"id":5381897883222016,"title":"ALBERT : Training the Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"albert-training-the-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5321505307885568,"id":5321505307885568,"title":"ALBERT : Embeddings Extraction","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"albert-embeddings-extraction"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6329838437400576,"id":6329838437400576,"title":"RoBERTa","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"roberta"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4758397917069312,"id":4758397917069312,"title":"RoBERTa Tokenizer","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"roberta-tokenizer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6652283375583232,"id":6652283375583232,"title":"ELECTRA","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"electra"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5495729628643328,"id":5495729628643328,"title":"Generator and Discriminator of the ELECTRA Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"generator-and-discriminator-of-the-electra-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5506784404701184,"id":5506784404701184,"title":"Training the ELECTRA Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"training-the-electra-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5274713899925504,"id":5274713899925504,"title":"SpanBERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"spanbert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6208314095173632,"id":6208314095173632,"title":"SpanBERT: Exploring Architecture","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"spanbert-exploring-architecture"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5155457086521344,"id":5155457086521344,"title":"Summary: Different BERT Variants","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"summary-different-bert-variants"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6618298620575744,"id":6618298620575744,"title":"Quiz: Different BERT Variants","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-different-bert-variants"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Practice using ALBERT, RoBERTa, ELECTRA, and SpanBERT for task-specific NLP improvements."},{"id":"inghygjib","title":"BERT Variants—Based on Knowledge Distillation","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":5742658388230144,"id":5742658388230144,"title":"Knowledge Distillation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"knowledge-distillation"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5917180961751040,"id":5917180961751040,"title":"Training the Student Network","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"training-the-student-network"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4910838197256192,"id":4910838197256192,"title":"DistilBERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"distilbert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6272600914001920,"id":6272600914001920,"title":"Training the Student BERT (DistilBERT)","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"training-the-student-bert-distilbert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5155620312055808,"id":5155620312055808,"title":"TinyBERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"tinybert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6125619516276736,"id":6125619516276736,"title":"Teacher-Student Architecture","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"teacher-student-architecture"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6554995349258240,"id":6554995349258240,"title":"Distillation of Transformer Layer","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"distillation-of-transformer-layer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6695774076010496,"id":6695774076010496,"title":"Distillation of Embedding and Prediction Layer","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"distillation-of-embedding-and-prediction-layer"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4549473811038208,"id":4549473811038208,"title":"Distillation Techniques for Pre-training and Fine-tuning","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"distillation-techniques-for-pre-training-and-fine-tuning"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5874595263152128,"id":5874595263152128,"title":"Data Augmentation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"data-augmentation"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6405186573303808,"id":6405186573303808,"title":"Transferring Knowledge from BERT to Neural Networks","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"transferring-knowledge-from-bert-to-neural-networks"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6738512072933376,"id":6738512072933376,"title":"The Data Augmentation Methods","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"the-data-augmentation-methods"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4659082718609408,"id":4659082718609408,"title":"Summary: BERT Variants—Based on Knowledge Distillation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"summary-bert-variants-based-on-knowledge-distillation"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4899036857106432,"id":4899036857106432,"title":"Quiz: BERT Variants—Based on Knowledge Distillation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-bert-variants-based-on-knowledge-distillation"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Try out knowledge distillation in BERT variants, including DistilBERT and TinyBERT."},{"id":"y5pbzdsqb","title":"Applications of BERT","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":4762752240058368,"id":4762752240058368,"title":"Introduction: Applications of BERT","is_preview":true,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"introduction-applications-of-bert"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Look at BERT's diverse applications in text summarization, multilingual tasks, and specialized fields."},{"id":"0ur4d9x6j","title":"Exploring BERTSUM for Text Summarization","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":6167653390221312,"id":6167653390221312,"title":"Text Summarization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"text-summarization"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5871058081808384,"id":5871058081808384,"title":"Fine-Tuning BERT for Extractive Summarization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"fine-tuning-bert-for-extractive-summarization"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6190839816257536,"id":6190839816257536,"title":"BERTSUM for Extractive Summary","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"bertsum-for-extractive-summary"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5410057409527808,"id":5410057409527808,"title":"BERTSUM for Abstractive Summarization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"bertsum-for-abstractive-summarization"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5279388314370048,"id":5279388314370048,"title":"ROUGE Evaluation Metrics","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"rouge-evaluation-metrics"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5222994202591232,"id":5222994202591232,"title":"Training the BERTSUM Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"training-the-bertsum-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4969203511328768,"id":4969203511328768,"title":"Summary: Exploring BERTSUM for Text Summarization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"summary-exploring-bertsum-for-text-summarization"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6210577598513152,"id":6210577598513152,"title":"Quiz: Exploring BERTSUM for Text Summarization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-exploring-bertsum-for-text-summarization"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Examine text summarization and fine-tuning BERTSUM for extractive and abstractive summaries."},{"page_id":5321369706037248,"id":4656497543217152,"title":"Semantic Search with Transformers","pages":[],"editMode":false,"type":"PATH_EXTERNAL_PROJECT","author_id":10370001,"collection_id":6069862070484992,"is_required":false,"detail_id":"project_10370001_6069862070484992_5321369706037248","cover_image_serving_url":null,"collection_read_time":0,"page_count":0,"brief_summary":null,"course_url_slug":null,"assessments_keys":[],"projects_keys":[],"optional_lessons":[],"time_limit":null},{"id":"vwaqcc394","title":"Applying BERT to Other Languages","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":5663505946247168,"id":5663505946247168,"title":"Understanding Multilingual BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"understanding-multilingual-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4752354488090624,"id":4752354488090624,"title":"Evaluating M-BERT on the NLI task","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"evaluating-m-bert-on-the-nli-task"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4979439559245824,"id":4979439559245824,"title":"How Multilingual is Multilingual BERT?","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"how-multilingual-is-multilingual-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6698394858553344,"id":6698394858553344,"title":"M-BERT Generalization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"m-bert-generalization"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6498674701762560,"id":6498674701762560,"title":"Effect of Code-Switching and Transliteration","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"effect-of-code-switching-and-transliteration"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6446375161823232,"id":6446375161823232,"title":"The Cross-Lingual Language Model (XLM)","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"the-cross-lingual-language-model-xlm"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4741229272891392,"id":4741229272891392,"title":"The XLM-R Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"the-xlm-r-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6013655881351168,"id":6013655881351168,"title":"Language-Specific BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"language-specific-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6325686379479040,"id":6325686379479040,"title":"BETO for Spanish","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"beto-for-spanish"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6622428857630720,"id":6622428857630720,"title":"BERTje for Dutch","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"bertje-for-dutch"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6504592030040064,"id":6504592030040064,"title":"German BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"german-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5942371549970432,"id":5942371549970432,"title":"Chinese BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"chinese-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5636105552265216,"id":5636105552265216,"title":"Japanese BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"japanese-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5331026307710976,"id":5331026307710976,"title":"FinBERT for Finnish","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"finbert-for-finnish"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5667234133049344,"id":5667234133049344,"title":"BERT Models for Italian and Portuguese","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"bert-models-for-italian-and-portuguese"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4855757507657728,"id":4855757507657728,"title":"RuBERT for Russian","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"rubert-for-russian"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5578736130588672,"id":5578736130588672,"title":"Summary: Applying BERT to Other Languages","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"summary-applying-bert-to-other-languages"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5194621476667392,"id":5194621476667392,"title":"Quiz: Applying BERT to Other Languages","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-applying-bert-to-other-languages"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Grasp the fundamentals of utilizing multilingual and monolingual BERT models in various languages."},{"id":"jprhk7buv","title":"Exploring Sentence and Domain-Specific BERT","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":6219496798552064,"id":6219496798552064,"title":"Sentence-BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"sentence-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6610606402306048,"id":6610606402306048,"title":"Sentence-BERT with a Siamese Network","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"sentence-bert-with-a-siamese-network"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6273575637745664,"id":6273575637745664,"title":"Sentence-BERT with a Triplet Network","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"sentence-bert-with-a-triplet-network"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5036430306574336,"id":5036430306574336,"title":"Use Cases of Sentence-BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"use-cases-of-sentence-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4518662494748672,"id":4518662494748672,"title":"Learning Multilingual Embeddings Through Knowledge Distillation","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"learning-multilingual-embeddings-through-knowledge-distillation"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5605010047762432,"id":5605010047762432,"title":"Multilingual Sentence-BERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"multilingual-sentence-bert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6228184678531072,"id":6228184678531072,"title":"Domain-Specific BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"domain-specific-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6201506447228928,"id":6201506447228928,"title":"BioBERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"biobert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4697817123389440,"id":4697817123389440,"title":"Summary: Exploring Sentence and Domain-Specific BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"summary-exploring-sentence-and-domain-specific-bert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4940972989087744,"id":4940972989087744,"title":"Quiz: Exploring Sentence and Domain-Specific BERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-exploring-sentence-and-domain-specific-bert"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Dig into Sentence-BERT enhancements and domain-specific adaptations like ClinicalBERT and BioBERT."},{"id":"css87bh1i","title":"Working with VideoBERT, BART, and More","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":5043421464756224,"id":5043421464756224,"title":"VideoBERT Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"videobert-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5752883196461056,"id":5752883196461056,"title":"Pre-training Dataset and Applications of VideoBERT","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"pre-training-dataset-and-applications-of-videobert"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5874689702100992,"id":5874689702100992,"title":"BART Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"bart-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6478584224677888,"id":6478584224677888,"title":"Noising Techniques","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"noising-techniques"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4803836981805056,"id":4803836981805056,"title":"Performing Text Summarization with BART","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"performing-text-summarization-with-bart"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6185064725217280,"id":6185064725217280,"title":"Exploring BERT Libraries","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"exploring-bert-libraries"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":6202020970889216,"id":6202020970889216,"title":"Building a Document Answering Model","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"building-a-document-answering-model"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5830086349291520,"id":5830086349291520,"title":"Document Summarization","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"document-summarization"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":4683756314820608,"id":4683756314820608,"title":"Summary: Working with VideoBERT, BART, and More","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"summary-working-with-videobert-bart-and-more"},{"author_id":10370001,"collection_id":5503708543844352,"page_id":5439422331617280,"id":5439422331617280,"title":"Quiz: Working with VideoBERT, BART, and More","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"quiz-working-with-videobert-bart-and-more"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"See how VideoBERT integrates video and language, and explore BART's text, document summation."},{"id":"4z5u3e19w","title":"Conclusion","pages":[{"author_id":10370001,"collection_id":5503708543844352,"page_id":6305674151329792,"id":6305674151329792,"title":"What We've Learned","is_preview":false,"parentIndex":"","editMode":false,"is_recovered":false,"type":"collection_lesson","can_edit":false,"is_standalone_module":false,"is_cloned":false,"brief_summary":"","slug":"what-weve-learned"}],"editMode":false,"type":"COLLECTION_CATEGORY","summary":"Approach Google BERT for state-of-the-art NLP applications and innovative projects."},{"page_id":5617902204747776,"id":5819431610875904,"title":"Similarity Detection in English Language Using RoBERTa","pages":[],"editMode":false,"type":"PATH_EXTERNAL_PROJECT","author_id":10370001,"collection_id":5720855154524160,"is_required":false,"detail_id":"project_10370001_5720855154524160_5617902204747776","cover_image_serving_url":null,"collection_read_time":0,"page_count":0,"brief_summary":null,"course_url_slug":null,"assessments_keys":[],"projects_keys":[],"optional_lessons":[],"time_limit":null}]},"page_titles":{"4742829753761792":"Introduction to the Transformer","6499551304482816":"Self-Attention Mechanism","4509778905923584":"Understanding the Self-Attention Mechanism","5876354502623232":"Multi-Head Attention Mechanism","4698798382383104":"Learning Position with Positional Encoding","5464204206407680":"Encoder: Feedforward and Add and Norm Component","5762202140409856":"Understanding the Decoder of the Transformer","5154145953906688":"Masked Multi-Head Attention","6635805836836864":"Multi-Head Attention","5850605385154560":"Decoder: Feedforward and Add and Norm Component","5672614944309248":"Putting the Encoder and Decoder Together","5761371903098880":"Putting All the Decoder Components Together","6464994215723008":"Summary: A Primer on Transformers","6057006397128704":"Understanding the Encoder of the Transformer","5246546387140608":"Putting All the Encoder Components Together","5340244668055552":"Quiz: A Primer on Transformers","4541267806781440":"Introduction to the BERT Model","6701391946186752":"Working of BERT","5592027998978048":"Pre-Training the BERT Model","5429274441154560":"The WordPiece Tokenizer","6714643581239296":"Exercise: A Primer on Transformers","5739524943773696":"Masked Language Modeling","4570339635101696":"Next Sentence Prediction","6062561278820352":"Exercise: Decoder Architecture","6189015350116352":"Pre-Training Procedure","5704766545199104":"Subword Tokenization Algorithms","5140522162454528":"Byte Pair Encoding","4648084985610240":"Byte-Level Byte Pair Encoding and WordPiece Algorithms","6219539833683968":"Summary: Understanding the BERT Model","6599140191764480":"Quiz: Understanding the BERT Model","4971850433298432":"Exploring the Pre-Trained BERT Model","5050864124559360":"Transformers","6431731392708608":"Extracting Embeddings From All Encoder Layers of BERT","4685888893485056":"Fine-Tuning BERT for Downstream Tasks","5720098244657152":"Natural Language Inference","5966695385792512":"Question-Answering","5897824243023872":"Performing Question-Answering with the Fine-Tuned BERT","5014647181934592":"Named Entity Recognition","5097239084269568":"Summary: Getting Hands-On with BERT","6456371202228224":"Sentiment Analysis","5626058284728320":"Quiz: Getting Hands-On with BERT","6549758613913600":"ALBERT","5381897883222016":"ALBERT : Training the Model","5321505307885568":"ALBERT : Embeddings Extraction","6329838437400576":"RoBERTa","4758397917069312":"RoBERTa Tokenizer","6652283375583232":"ELECTRA","5495729628643328":"Generator and Discriminator of the ELECTRA Model","5506784404701184":"Training the ELECTRA Model","5274713899925504":"SpanBERT","6208314095173632":"SpanBERT: Exploring Architecture","5155457086521344":"Summary: Different BERT Variants","6618298620575744":"Quiz: Different BERT Variants","5742658388230144":"Knowledge Distillation","5917180961751040":"Training the Student Network","4910838197256192":"DistilBERT","6272600914001920":"Training the Student BERT (DistilBERT)","5155620312055808":"TinyBERT","6125619516276736":"Teacher-Student Architecture","6554995349258240":"Distillation of Transformer Layer","6695774076010496":"Distillation of Embedding and Prediction Layer","5352220988801024":"About the Course","5568493412679680":"Configurations of BERT","4820899526868992":"Pre-Training Strategies for the BERT Model","5054422676406272":"Introduction: BERT","6143068515074048":"Introducion: BERT Variants","4549473811038208":"Distillation Techniques for Pre-training and Fine-tuning","6405186573303808":"Transferring Knowledge from BERT to Neural Networks","6738512072933376":"The Data Augmentation Methods","4659082718609408":"Summary: BERT Variants—Based on Knowledge Distillation","4762752240058368":"Introduction: Applications of BERT","6167653390221312":"Text Summarization","5871058081808384":"Fine-Tuning BERT for Extractive Summarization","6190839816257536":"BERTSUM for Extractive Summary","5410057409527808":"BERTSUM for Abstractive Summarization","5279388314370048":"ROUGE Evaluation Metrics","5222994202591232":"Training the BERTSUM Model","4969203511328768":"Summary: Exploring BERTSUM for Text Summarization","5663505946247168":"Understanding Multilingual BERT","4752354488090624":"Evaluating M-BERT on the NLI task","4979439559245824":"How Multilingual is Multilingual BERT?","6698394858553344":"M-BERT Generalization","6498674701762560":"Effect of Code-Switching and Transliteration","6446375161823232":"The Cross-Lingual Language Model (XLM)","4741229272891392":"The XLM-R Model","6013655881351168":"Language-Specific BERT","6325686379479040":"BETO for Spanish","6622428857630720":"BERTje for Dutch","4899036857106432":"Quiz: BERT Variants—Based on Knowledge Distillation","6210577598513152":"Quiz: Exploring BERTSUM for Text Summarization","6504592030040064":"German BERT","5942371549970432":"Chinese BERT","5636105552265216":"Japanese BERT","5331026307710976":"FinBERT for Finnish","5667234133049344":"BERT Models for Italian and Portuguese","4855757507657728":"RuBERT for Russian","5578736130588672":"Summary: Applying BERT to Other Languages","6219496798552064":"Sentence-BERT","6610606402306048":"Sentence-BERT with a Siamese Network","6273575637745664":"Sentence-BERT with a Triplet Network","5036430306574336":"Use Cases of Sentence-BERT Model","4518662494748672":"Learning Multilingual Embeddings Through Knowledge Distillation","5605010047762432":"Multilingual Sentence-BERT Model","6228184678531072":"Domain-Specific BERT","6201506447228928":"BioBERT","4697817123389440":"Summary: Exploring Sentence and Domain-Specific BERT","5043421464756224":"VideoBERT Model","5752883196461056":"Pre-training Dataset and Applications of VideoBERT","5874689702100992":"BART Model","6478584224677888":"Noising Techniques","4803836981805056":"Performing Text Summarization with BART","6202020970889216":"Building a Document Answering Model","6185064725217280":"Exploring BERT Libraries","5830086349291520":"Document Summarization","4683756314820608":"Summary: Working with VideoBERT, BART, and More","5194621476667392":"Quiz: Applying BERT to Other Languages","4940972989087744":"Quiz: Exploring Sentence and Domain-Specific BERT","5439422331617280":"Quiz: Working with VideoBERT, BART, and More","6305674151329792":"What We've Learned","5874595263152128":"Data Augmentation"},"page_tags":{"4742829753761792":"","6499551304482816":"","4509778905923584":"","5876354502623232":"","4698798382383104":"","5464204206407680":"","5762202140409856":"","5154145953906688":"","6635805836836864":"","5850605385154560":"","5761371903098880":"","5672614944309248":"","6464994215723008":"","6057006397128704":"","5246546387140608":"","5340244668055552":"","4541267806781440":"","6701391946186752":"","5592027998978048":"","5429274441154560":"","6714643581239296":"","5739524943773696":"","4570339635101696":"","6062561278820352":"","6189015350116352":"","5704766545199104":"","5140522162454528":"","4648084985610240":"","6219539833683968":"","6599140191764480":"","4971850433298432":"","5050864124559360":"","6431731392708608":"","4685888893485056":"","5720098244657152":"","5966695385792512":"","5897824243023872":"","5014647181934592":"","5097239084269568":"","6456371202228224":"","6549758613913600":"","5381897883222016":"","5321505307885568":"","6329838437400576":"","4758397917069312":"","6652283375583232":"","5495729628643328":"","5506784404701184":"","5274713899925504":"","6208314095173632":"","5155457086521344":"","6618298620575744":"","5742658388230144":"","5917180961751040":"","4910838197256192":"","6272600914001920":"","5155620312055808":"","6125619516276736":"","6554995349258240":"","6695774076010496":"","5626058284728320":"","5352220988801024":"","5568493412679680":"","4820899526868992":"","5054422676406272":"","6143068515074048":"","4549473811038208":"","6405186573303808":"","6738512072933376":"","4659082718609408":"","4762752240058368":"","6167653390221312":"","5871058081808384":"","6190839816257536":"","5410057409527808":"","5279388314370048":"","5222994202591232":"","4969203511328768":"","5663505946247168":"","4752354488090624":"","4979439559245824":"","6698394858553344":"","6498674701762560":"","6446375161823232":"","4741229272891392":"","6013655881351168":"","6325686379479040":"","6622428857630720":"","4899036857106432":"","6210577598513152":"","6504592030040064":"","5942371549970432":"","5636105552265216":"","5331026307710976":"","5667234133049344":"","4855757507657728":"","5578736130588672":"","6219496798552064":"","6610606402306048":"","6273575637745664":"","5036430306574336":"","4518662494748672":"","5605010047762432":"","6228184678531072":"","6201506447228928":"","4697817123389440":"","5043421464756224":"","5752883196461056":"","5874689702100992":"","6478584224677888":"","4803836981805056":"","6185064725217280":"","6202020970889216":"","5830086349291520":"","4683756314820608":"","5194621476667392":"","4940972989087744":"","5439422331617280":"","6305674151329792":"","5874595263152128":""},"collection_toc_is_enabled":true,"page_count":null,"docker":{"container":{"file":{"name":"bert.tar.gz","size":2109},"imageName":"author-10370001-collection-5503708543844352-rev-35-container-5211182323204096-bert","buildStatus":"SUCCESS","buildStatusUrl":"/api/author/10370001/collection/5503708543844352/containers/5211182323204096/build/status","buildLogUrl":"/api/author/10370001/collection/5503708543844352/containers/5211182323204096/build/log","metadata":{"sizeInBytes":2109},"id":-1,"tarballDownloadUrl":"/api/author/10370001/collection/5503708543844352/containers/5211182323204096/download","rebuildImageUrl":"/api/author/10370001/collection/5503708543844352/containers/5211182323204096/rebuild","track":false},"envs":[],"jobs":[{"key":"OjjcZssNLKXysn19Pi5Rj","jobType":"Live","name":"chap_5","inputFileName":"foo","runScript":"cp -r /usercode/chapter5/* /usr/local/notebooks && nohup jupyter notebook /usr/local/notebooks/ --allow-root --no-browser > /dev/null 2>&1 &","ports":"8080","startScript":"echo \"hello\"","runInLiveContainer":true},{"key":"O3vYVfSTBGOy573QxtXRf","jobType":"Live","name":"chap_7","inputFileName":"foo","runScript":"cp -r /usercode/chapter7/* /usr/local/notebooks && nohup jupyter notebook /usr/local/notebooks/ --allow-root --no-browser > /dev/null 2>&1 &","ports":"8080","startScript":"echo \"hello\"","runInLiveContainer":true},{"key":"l1dwWHOTGeD2QgasSj_DJ","jobType":"Live","name":"chap_11","inputFileName":"foo","runScript":"cp -r /usercode/chapter11/* /usr/local/notebooks && nohup jupyter notebook /usr/local/notebooks/ --allow-root --no-browser > /dev/null 2>&1 &","ports":"8080","startScript":"echo \"hello\"","runInLiveContainer":true},{"key":"kMJmMC5MBCQHvyGGRqbik","jobType":"Live","name":"chap_12","inputFileName":"foo","runScript":"cp -r /usercode/chapter12/* /usr/local/notebooks && nohup jupyter notebook /usr/local/notebooks/ --allow-root --no-browser > /dev/null 2>&1 &","ports":"8080","startScript":"echo \"hello\"","runInLiveContainer":true},{"key":"EpJo9pOe86F7uhEsQ_Lhc","jobType":"Live","name":"chap_13","inputFileName":"foo","runScript":"cp -r /usercode/chapter13/* /usr/local/notebooks && nohup jupyter notebook /usr/local/notebooks/ --allow-root --no-browser > /dev/null 2>&1 &","ports":"8080","startScript":"echo \"hello\"","runInLiveContainer":true},{"key":"H9vBlQyVQJWpwqAdgR5iD","jobType":"Live","name":"chap_13_document_answering","inputFileName":"foo","runScript":"cp -r /usercode/chapter13/* /usr/local/notebooks && cp -r /usercode/bbc-fulltext.zip /usr/local/notebooks && nohup jupyter notebook /usr/local/notebooks/ --allow-root --no-browser > /dev/null 2>&1 &","ports":"8080","startScript":"echo \"hello\"","runInLiveContainer":true}],"testRunners":[],"version":3,"loaded":true},"discounted_price":29,"cover_image_id":6183930695516160,"cover_image_metadata":"{\"width\":1024,\"height\":512,\"sizeInBytes\":41630,\"name\":\"_Packt MBE - Getting Started with Google BERT .png\"}","cover_image_serving_url":"/v2api/collection/10370001/5503708543844352/image/6183930695516160","tags":["transformers","encoder/decoder","nlp","bert","deep learning"],"intro_video_url":"","intro_video_thumbnail_url":"","aggregated_widget_stats":{"projects":0,"assessments":0,"SlateHTML":818,"codeExerciseCount":0,"codeRunnableCount":26,"codeSnippetCount":250,"illustrations":249,"DrawIOWidget":233,"Columns":16,"Latex":182,"Quiz":9,"Permutation":2,"EditorCode":250,"LiveApp":26,"TerminalWidget":0,"WebpackBin":0,"Table":31,"cloudlabs":0,"StructuredQuiz":3,"TableHTML":1},"default_themes":{"code_themes":{"Code":"default","Markdown":"default","RunJS":"default","SPA":"default","isForced":{"Code":false,"Markdown":false,"RunJS":false,"SPA":false}}},"api_keys":{"api_keys":[]},"skills":["Transformer Models","Machine Learning"],"testimonials":[],"licensing":null,"target_audience":"intermediate","author_id":"10370001","collection_id":"5503708543844352","approval_status":3005,"price":29,"is_private":false,"path_type":"regular","organization_id":null,"is_mini":false,"is_priced":true,"brief_summary":"Explore Google BERT, fine-tune NLP tasks, discover variants, and build real-world applications with cutting-edge transformer models.","approval_update_time":"2023-12-12T12:44:20.445Z","rating_visibility":true,"update_last_published_on_homepage":true,"show_developed_by":true,"udata_files":[],"CodeThemes":{"Code":"default","Markdown":"default","RunJS":"default","SPA":"default","isForced":{"Code":false,"Markdown":false,"RunJS":false,"SPA":false}},"is_marked_for_deletion":false,"transition_page_title":"","is_redirectable":false,"collection_type":"collection","adaptive_learning_mode":false,"HLOs_to_toc":{},"is_guide":false,"read_time":90000,"allow_logged_out_executions":false,"unique_live_widget_urls":false,"metadata_status":101},"pageSummarySSR":{"title":"Training the BERTSUM Model","description":"Learn how to train the BERTSUM model on the CNN/DailyMail news dataset.","discourse_page_url":"https://discuss.educative.io/tag/training-the-bertsum-model__exploring-bertsum-for-text-summarization__getting-started-with-google-bert?open=true&ctag=getting-started-with-google-bert__packt&cslug=google-bert&pslug=training-the-bertsum-model"},"adaptiveLearningConfigConstantSSR":0,"enableLessonPageLockedBannerV2":true,"allowAllLessonPreview":false,"lockedBannerStatsSSR":{"b2cTrialStats":{"is_b2c_trial_active":true,"b2c_trial_active_duration":7,"b2c_trial_categories":"$125"},"b2cStatus":100,"learnerTags":"$126","workStats":1450,"interviewWorksStats":78,"inL2cStarterPack":false,"l2cWorkStats":43,"enableL2cStarterPackPaymentWidget":"true"},"pageTocSSR":"

Training the model

","authorId":"10370001","collectionId":"5503708543844352","pageId":"5222994202591232","isCollectionPageLockedCachingEnabled":true,"aceFeatureFlags":{"enableAceEditor":true,"enableAceEditorForAnswers":true},"meta":{"type":["Article","TechArticle"],"title":"Training the BERTSUM Model","name":"Getting Started with Google BERT","description":"Learn how to train the BERTSUM model on the CNN/DailyMail news dataset.","image":"https://educative.io/api/collection/10370001/5503708543844352/image/6183930695516160.png","isAccessibleForFree":false,"keywords":"$126","provider":"Educative","publisher":"Educative","id":"courses/google-bert/training-the-bertsum-model","author":"Educative","educationalLevel":"intermediate","noIndex":true,"isForcedNoIndex":true,"noFollow":false,"redirectInfo":{"isDeletedCollectionPageRedirectable":false},"page_titles":"$127","is_marked_for_deletion":false,"transition_page_title":"","is_redirectable":false,"deleted_course_lesson_redirect":{"author_id":null,"collection_id":null,"page_id":null,"redirect_url_slug":null},"metadata_status":101,"additional_course_alternatives":[]},"requestUrl":"/courses/google-bert/training-the-bertsum-model","requestUrlInfo":{"authorId":"10370001","collectionId":"5503708543844352","pageId":"5222994202591232","courseUrlSlug":"google-bert","pageUrlSlug":"training-the-bertsum-model"},"isExternalContent":false}}],[["$","script",null,{"id":"generate-data","type":"application/ld+json","dangerouslySetInnerHTML":{"__html":"$128"}}],false,"$undefined"]]