= BIGDATA - Big Data with NoSQL Databases = == Requirements == 7,5 hp databaser och 7,5 hp programming == Aim == Kursens övergripande mål är att ge studenten kunskaper om verktyg och modeller för hantering av och tillämpningar baserade på stora datamängder. Kursen kommer att gå igenom motiveringen bakom utvecklingen mot big data och de tekniker som utvecklats för att hantera stora mängder data. Dessa kan vanligtvis inte hanteras av traditionella databashanteringssystem på grund av datans volym, variation och hastigheten med vilken de genereras. Alternativa former för representationer av data har därför utvecklats inom ramverket NoSQL. Kursen tar upp olika ansatser för NoSQL inom Hadoop, vilket är ett modulärt ramverk som tillåter distribuerad lagring och analys av stora datamängder. Vi kommer att gå igenom olika datakällor samt typer av data, inklusive strömmande data. Kursen kommer även att behandla prediktiv modellering med stora mängder data och ge exempel på några typiska tillämpningar. == Syllabus == Efter genomförd kurs ska studenten kunna: * beskriva de utmaningar och möjligheter som finns med stora datamängder * beskriva datakällor, typer av data samt egenskaper hos stora datamängder * beskriva Hadoop-ramverkets modulära arkitektur * analysera vilka representationsformer som är lämpliga med avseende på typ av data och tillämpning * analysera behov och effekt av distribuerad lagring och analys * tillämpa insamling och lagring av stora datamängder * tillämpa prediktiv modellering med stora datamängder == Outline == Undervisningen består av föreläsningar och praktiska övningar/lektioner samt ett avslutande seminarium. Undervisningen sker på engelska.