Selamat datang di Scribd!

Overview

Diunggah oleh

0% menganggap dokumen ini bermanfaat (0 suara)

7 tayangan2 halaman

"Data mining" is the process of analyzing large amounts of data. Data mining can be thought of as algorithms for executing complex queries on non-main-memory data. It is a powerful tool, but there are challenges when the data is large and computations complex.

Deskripsi Asli:

Hak Cipta

Format Tersedia

PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Attribution Non-Commercial (BY-NC)

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

7 tayangan2 halaman

Overview

Diunggah oleh

vel.sakthi3152

Hak Cipta:

Attribution Non-Commercial (BY-NC)

Format Tersedia

Unduh sebagai PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 2

Cari di dalam dokumen

1 What Is Data Mining?

Originally, data mining" was a statistician's term for overusing data to draw invalid inferences. Bonferroni's theorem warns us that if there are too many possible conclusions to draw, some will be true for purely statistical reasons, with no physical validity. Famous example: David Rhine, a parapsychologist" at Duke in the 1950's tested students for extrasensory perception" by asking them to guess 10 cards | red or black. He found about 1 1000 of them guessed all 10, and instead of realizing that that is what you'd expect from random guessing, declared them to have ESP. When he retested them, he found they did no better than average. His conclusion: telling people they have ESP causes them to lose it! Our de nition: discovery of useful summaries of data."

1.1 Applications

Some examples of successes": 1. Decision trees constructed from bank-loan histories to produce algorithms to decide whether to grant a loan. 2. Patterns of traveler behavior mined to manage the sale of discounted seats on planes, rooms in hotels, etc. 3. Diapers and beer." Observation that customers who buy diapers are more likely to by beer than average allowed supermarkets to place beer and diapers nearby, knowing many customers would walk between them. Placing potato chips between increased sales of all three items. 4. Skycat and Sloan Sky Survey: clustering sky objects by their radiation levels in di erent bands allowed astromomers to distinguish between galaxies, nearby stars, and many other kinds of celestial objects. 5. Comparison of the genotype of people with without a condition allowed the discovery of a set of genes that together account for many cases of diabetes. This sort of mining will become much more important as the human genome is constructed.

1.2 The Data-Mining Communities

1. 2. 3. 4. 5.

As data-mining has become recognized as a powerful tool, several di erent communities have laid claim to the subject: Statistics. AI, where it is called machine learning." Researchers in clustering algorithms. Visualization researchers. Databases. We'll be taking this approach, of course, concentrating on the challenges that appear when the data is large and the computations complex. In a sense, data mining can be thought of as algorithms for executing very complex queries on non-main-memory data.

1.3 Stages of the Data-Mining Process

1. Data gathering, e.g., data warehousing, Web crawling. 2. Data cleansing : eliminate errors and or bogus data, e.g., patient fever = 125. 3. Feature extraction : obtaining only the interesting attributes of the data, e.g., date acquired" is probably not useful for clustering celestial objects, as in Skycat. 4. Pattern extraction and discovery. This is the stage that is often thought of as data mining," and is where we shall concentrate our e ort. 5. Visualization of the data. 6. Evaluation of results; not every discovered fact is useful, or even true! Judgement is necessary before following your software's conclusions.

Anda mungkin juga menyukai

Fans Reference Guide
Dokumen160 halaman
Fans Reference Guide
karthikraja21
100% (13)
1.1 Introduction To Data Science 1
Dokumen17 halaman
1.1 Introduction To Data Science 1
Nguyen Hai Anh (K17 HL)
Belum ada peringkat
Silo Cement Calculation
Dokumen11 halaman
Silo Cement Calculation
Fikriaraz Afif
Belum ada peringkat
Tok Essay
Dokumen3 halaman
Tok Essay
Aaryan Chhabra
Belum ada peringkat
THK
Dokumen1.901 halaman
THK
api-26356646
Belum ada peringkat
Steps For Charm Configuration
Dokumen7 halaman
Steps For Charm Configuration
poornasap
Belum ada peringkat
Alpha New Bp12
Dokumen54 halaman
Alpha New Bp12
AUTO HUB
Belum ada peringkat
04.protection of 33KV Feeder.
Dokumen16 halaman
04.protection of 33KV Feeder.
gnpr_10106080
Belum ada peringkat
Data Mining: Concepts and Techniques: Jiawei Han and Micheline Kamber
Dokumen58 halaman
Data Mining: Concepts and Techniques: Jiawei Han and Micheline Kamber
Moneeb Abbas
0% (1)
Grokking Artificial Intelligence Algorithms
Dari Everand
Grokking Artificial Intelligence Algorithms
Rishal Hurbans
Belum ada peringkat
Design & Fabrication of a Cost-Effective Agricultural Drone
Dokumen57 halaman
Design & Fabrication of a Cost-Effective Agricultural Drone
Fatima Nasir R:29
Belum ada peringkat
Mastering The Art Of Data Analysis From Basics To Informed Decision-Making
Dari Everand
Mastering The Art Of Data Analysis From Basics To Informed Decision-Making
Space Learn
Belum ada peringkat
Big Data (Review and Analysis of Mayer-Schonberger and Cukier's Book)
Dari Everand
Big Data (Review and Analysis of Mayer-Schonberger and Cukier's Book)
BusinessNews Publishing
Belum ada peringkat
GL Setup List
Dokumen88 halaman
GL Setup List
Sundaroraclefin
Belum ada peringkat
10 Challenging Problems in Data Mining Research
Dokumen8 halaman
10 Challenging Problems in Data Mining Research
abhi_cool25
Belum ada peringkat
Summary of John C. Lennox's 2084
Dari Everand
Summary of John C. Lennox's 2084
IRB Media
Penilaian: 2.5 dari 5 bintang
2.5/5 (2)
English Unit 4
Dokumen3 halaman
English Unit 4
陳奕宏
Belum ada peringkat
Data Mining I: Introduction
Dokumen47 halaman
Data Mining I: Introduction
Hamed Rokni
Belum ada peringkat
EyeDetect PCSOT 10 5 17
Dokumen11 halaman
EyeDetect PCSOT 10 5 17
Rafael José Fragozo Larrazabal
Belum ada peringkat
DWDM Intro
Dokumen103 halaman
DWDM Intro
Battula Sudheer Kumar Naidu
Belum ada peringkat
Data Mining History
Dokumen2 halaman
Data Mining History
Muhammad Mukhrodi
Belum ada peringkat
Data Mining Essentials for Beginners
Dokumen6 halaman
Data Mining Essentials for Beginners
Agil Langga
Belum ada peringkat
Greene, Big - Data - in - Medicine PDF
Dokumen6 halaman
Greene, Big - Data - in - Medicine PDF
glitterglyptodon
Belum ada peringkat
CS345A Data Mining Course Introduction
Dokumen27 halaman
CS345A Data Mining Course Introduction
Kushe Shaya
Belum ada peringkat
Phenomenal Data Mining - From Data To Phenomena
Dokumen17 halaman
Phenomenal Data Mining - From Data To Phenomena
donald smith
Belum ada peringkat
Comprehension Grade 12
Dokumen4 halaman
Comprehension Grade 12
Nuaym Al Jafri
Belum ada peringkat
Data Science Overview New
Dokumen23 halaman
Data Science Overview New
Manish Kumar
Belum ada peringkat
(Skiena, 2017) - Book - The Data Science Design Manual - 3
Dokumen1 halaman
(Skiena, 2017) - Book - The Data Science Design Manual - 3
Antero
Belum ada peringkat
TAVANI (1999) Informational Privacy, Data Mining, and The Internet
Dokumen10 halaman
TAVANI (1999) Informational Privacy, Data Mining, and The Internet
Roberto Andrés Navarro Dolmestch
Belum ada peringkat
Data
Dokumen6 halaman
Data
Anonymous 2HTDgMt
Belum ada peringkat
The Differences Between Data, Information and Knowledge
Dokumen37 halaman
The Differences Between Data, Information and Knowledge
Cristina
Belum ada peringkat
Theory Contents - Unit 1
Dokumen35 halaman
Theory Contents - Unit 1
AndreaGilRuiz
Belum ada peringkat
Workshop VI: Quantum Biology: Does It Exist and Is This Important?
Dokumen24 halaman
Workshop VI: Quantum Biology: Does It Exist and Is This Important?
Sushmit
Belum ada peringkat
How Neurons Use Crowdsourcing To Make Decisions - ScienceDaily
Dokumen3 halaman
How Neurons Use Crowdsourcing To Make Decisions - ScienceDaily
AmrAlaaEldin
Belum ada peringkat
DM 01 Introduction ML Data Mining
Dokumen39 halaman
DM 01 Introduction ML Data Mining
Kiran Rokkam
Belum ada peringkat
Data Mining: Concepts and Techniques: Jiawei Han and Micheline Kamber
Dokumen46 halaman
Data Mining: Concepts and Techniques: Jiawei Han and Micheline Kamber
Fitrah Hidayat
Belum ada peringkat
Research Paper On DSP Applications
Dokumen7 halaman
Research Paper On DSP Applications
tys0v0kan1f3
100% (1)
Truth Is A Lie
Dokumen10 halaman
Truth Is A Lie
celinec_47
Belum ada peringkat
Artificial Inteligence
Dokumen10 halaman
Artificial Inteligence
Alexander Rios
Belum ada peringkat
The Mandela Effect-1
Dokumen6 halaman
The Mandela Effect-1
Francisco Cavero
Belum ada peringkat
The Government-Academia Complex and Big Data Religion
Dokumen8 halaman
The Government-Academia Complex and Big Data Religion
Francisco Araújo
Belum ada peringkat
Lighting Up The Lies
Dokumen5 halaman
Lighting Up The Lies
Dũng Hoàng
Belum ada peringkat
HCI Week 11 - Data at Scale
Dokumen16 halaman
HCI Week 11 - Data at Scale
Joyce Ann Rufino
Belum ada peringkat
Project #1
Dokumen5 halaman
Project #1
ANWAR SHAMIM
Belum ada peringkat
Introduction To Data Mining
Dokumen27 halaman
Introduction To Data Mining
petergitagia9781
Belum ada peringkat
Dm1 Introduction ML Data Mining
Dokumen39 halaman
Dm1 Introduction ML Data Mining
Subir Ranjan
Belum ada peringkat
Data Mining - Docx Unit 1
Dokumen10 halaman
Data Mining - Docx Unit 1
sukhpreet singh
Belum ada peringkat
GRAY - Jim Gray On Escience. A Transformed Scientific Method
Dokumen15 halaman
GRAY - Jim Gray On Escience. A Transformed Scientific Method
Yve Sant'ana
Belum ada peringkat
Artificial Intelligence and Decision-Making: The RUSI Journal
Dokumen9 halaman
Artificial Intelligence and Decision-Making: The RUSI Journal
Aparna Telang
Belum ada peringkat
STS Reporting
Dokumen10 halaman
STS Reporting
Celene Delmonte Gingo
Belum ada peringkat
SASING
Dokumen8 halaman
SASING
rozan
Belum ada peringkat
01 Intro 1
Dokumen50 halaman
01 Intro 1
baigsalman251
Belum ada peringkat
Worksheet in GE Math: #5 Nature of Mathematics 1.3 Mathematics For Our World
Dokumen4 halaman
Worksheet in GE Math: #5 Nature of Mathematics 1.3 Mathematics For Our World
AMOLAR, ROSSEL JOY C.
Belum ada peringkat
Inside BIG DATA - Guide To Scientific Research
Dokumen10 halaman
Inside BIG DATA - Guide To Scientific Research
nicolepetrescu
Belum ada peringkat
1 Intor To DMW
Dokumen22 halaman
1 Intor To DMW
Marco
Belum ada peringkat
College of Computer and Information Sciences: Polytechnic University of The University
Dokumen15 halaman
College of Computer and Information Sciences: Polytechnic University of The University
Rrjer Jahj Rollon Cuevas
Belum ada peringkat
The End of Theory - The Data Deluge Makes The Scientific Method Obsolete
Dokumen2 halaman
The End of Theory - The Data Deluge Makes The Scientific Method Obsolete
claudio castro
Belum ada peringkat
Cognitive Bias: by Fahad Nari Ram Ramalingam
Dokumen32 halaman
Cognitive Bias: by Fahad Nari Ram Ramalingam
Ram Ramalingam
Belum ada peringkat
Data Mining: Concepts and Techniques: Jiawei Han and Micheline Kamber
Dokumen46 halaman
Data Mining: Concepts and Techniques: Jiawei Han and Micheline Kamber
Kurumeti Naga Surya Lakshmana Kumar
Belum ada peringkat
Ai Mundane Task
Dokumen7 halaman
Ai Mundane Task
Annapoorni Av
Belum ada peringkat
Tanner: Legal Questions Raised by The Widespread Aggregation of Personal Data
Dokumen9 halaman
Tanner: Legal Questions Raised by The Widespread Aggregation of Personal Data
New England Law Review
Belum ada peringkat
Data Mining Techniques Course Overview
Dokumen56 halaman
Data Mining Techniques Course Overview
Alhassan Imrana Timtonie
Belum ada peringkat
Your Brain Lies To You
Dokumen3 halaman
Your Brain Lies To You
free
Belum ada peringkat
Unraveling The Enigma of Human Intelligence - Toby & Cosmides
Dokumen40 halaman
Unraveling The Enigma of Human Intelligence - Toby & Cosmides
Reuben Rabinovich
Belum ada peringkat
Pengantar BioSistem
Dokumen37 halaman
Pengantar BioSistem
Fadhlan
Belum ada peringkat
Can Our Brains Handle The Information Age?
Dokumen6 halaman
Can Our Brains Handle The Information Age?
Anonymous haOGKg8JUV
Belum ada peringkat
Data Science - 20231007 - 183814 - 0000
Dokumen20 halaman
Data Science - 20231007 - 183814 - 0000
mayankash84
Belum ada peringkat
AI in Health Care Introduction
Dokumen6 halaman
AI in Health Care Introduction
vishnukaushikvarma
Belum ada peringkat
Different Query Optimization Techniques (QOT) Using Data Mining Technology
Dokumen9 halaman
Different Query Optimization Techniques (QOT) Using Data Mining Technology
vel.sakthi3152
Belum ada peringkat
Streaming Algorithms: Counting Bits with DGIM Algorithm
Dokumen90 halaman
Streaming Algorithms: Counting Bits with DGIM Algorithm
vel.sakthi3152
Belum ada peringkat
Pondicherry University BSc Mathematics Regulations and Syllabus
Dokumen34 halaman
Pondicherry University BSc Mathematics Regulations and Syllabus
Nunna Maheshbabu
Belum ada peringkat
Mining Data Streams (Part 2) : Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman
Dokumen46 halaman
Mining Data Streams (Part 2) : Mining of Massive Datasets Jure Leskovec, Anand Rajaraman, Jeff Ullman
UCET
Belum ada peringkat
Android Workshop Reqletter.35 PDF
Dokumen2 halaman
Android Workshop Reqletter.35 PDF
vel.sakthi3152
Belum ada peringkat
Quantum Studies in IISC
Dokumen133 halaman
Quantum Studies in IISC
vel.sakthi3152
100% (1)
Web Based Electronic Wireless Lab Environment (EWL) For Engineering Students Using Wi-Fi Architecture
Dokumen10 halaman
Web Based Electronic Wireless Lab Environment (EWL) For Engineering Students Using Wi-Fi Architecture
vel.sakthi3152
Belum ada peringkat
It1351 2 Marks PDF
Dokumen25 halaman
It1351 2 Marks PDF
vel.sakthi3152
Belum ada peringkat
Web Mashups-Nirav Shah
Dokumen12 halaman
Web Mashups-Nirav Shah
vel.sakthi3152
Belum ada peringkat
Hybrid Heuristics Speed Up Route Optimization
Dokumen20 halaman
Hybrid Heuristics Speed Up Route Optimization
vel.sakthi3152
Belum ada peringkat
MC9251 Middleware Technologies
Dokumen7 halaman
MC9251 Middleware Technologies
vel.sakthi3152
Belum ada peringkat
Research Links
Dokumen1 halaman
Research Links
vel.sakthi3152
Belum ada peringkat
C:/oracle/orahome/jdbc/lib/classes12.jar in The Command Prompt
Dokumen2 halaman
C:/oracle/orahome/jdbc/lib/classes12.jar in The Command Prompt
vel.sakthi3152
Belum ada peringkat
Usage of Debit Card Online Guidelines To Cardhodlers
Dokumen2 halaman
Usage of Debit Card Online Guidelines To Cardhodlers
RamanKaur
Belum ada peringkat
Raw Socket Tutorial
Dokumen12 halaman
Raw Socket Tutorial
vel.sakthi3152
Belum ada peringkat
Advanced Visual Basic Lab
Dokumen243 halaman
Advanced Visual Basic Lab
Malathi Sankar
Belum ada peringkat
A Fuzzy Based Automatic Pap Screening System - ROI Detection
Dokumen4 halaman
A Fuzzy Based Automatic Pap Screening System - ROI Detection
vel.sakthi3152
Belum ada peringkat
Ethical Hacking Presentation October 2006
Dokumen98 halaman
Ethical Hacking Presentation October 2006
PARAG
100% (2)
Unit1 Middle New
Dokumen19 halaman
Unit1 Middle New
vel.sakthi3152
Belum ada peringkat
Station Code
Dokumen2 halaman
Station Code
ami1577
Belum ada peringkat
Fire Detectio
Dokumen3 halaman
Fire Detectio
vel.sakthi3152
Belum ada peringkat
An Efficient Mechanism For Handling Inferences in Databases
Dokumen7 halaman
An Efficient Mechanism For Handling Inferences in Databases
vel.sakthi3152
Belum ada peringkat
A Fuzzy Based Automatic Pap Screening System - ROI Detection
Dokumen4 halaman
A Fuzzy Based Automatic Pap Screening System - ROI Detection
vel.sakthi3152
Belum ada peringkat
Mobile Database
Dokumen98 halaman
Mobile Database
vel.sakthi3152
Belum ada peringkat
IT 2353 Web Technology Notes
Dokumen52 halaman
IT 2353 Web Technology Notes
vel.sakthi3152
Belum ada peringkat
Dream Catcher - Synthesizing The Cognitive Maps
Dokumen6 halaman
Dream Catcher - Synthesizing The Cognitive Maps
vel.sakthi3152
Belum ada peringkat
Mc9211co U4l1
Dokumen83 halaman
Mc9211co U4l1
vel.sakthi3152
Belum ada peringkat
Example 1 LS Dyna - Bullet Model Simulation
Dokumen6 halaman
Example 1 LS Dyna - Bullet Model Simulation
sunil_vrv
Belum ada peringkat
Numeri Ordinali
Dokumen2 halaman
Numeri Ordinali
Claudio
Belum ada peringkat
8086 Instruction Set
Dokumen66 halaman
8086 Instruction Set
Raj Kumar
Belum ada peringkat
Turbine Buyers Guide - Mick Sagrillo & Ian Woofenden
Dokumen7 halaman
Turbine Buyers Guide - Mick Sagrillo & Ian Woofenden
Anonymous xYhjeilnZ
Belum ada peringkat
WebControls - TabStrip
Dokumen38 halaman
WebControls - TabStrip
Prokopis Pr
Belum ada peringkat
Solvent based printing inks applications
Dokumen34 halaman
Solvent based printing inks applications
Amna liaquat
Belum ada peringkat
Manual 1
Dokumen37 halaman
Manual 1
Şahin Güngör
Belum ada peringkat
Leroy Somer 3434c - GB-Ny
Dokumen28 halaman
Leroy Somer 3434c - GB-Ny
Cris_eu09
100% (1)
GAS-INSULATED SWITCHGEAR MODELS 72kV ADVANCED ENVIRONMENTALLY FRIENDLY
Dokumen6 halaman
GAS-INSULATED SWITCHGEAR MODELS 72kV ADVANCED ENVIRONMENTALLY FRIENDLY
Budi Santony
Belum ada peringkat
HI-8592, HI-8593, HI-8594: Single-Rail ARINC 429 Differential Line Driver
Dokumen14 halaman
HI-8592, HI-8593, HI-8594: Single-Rail ARINC 429 Differential Line Driver
sameeppai
Belum ada peringkat
Visualizing Interstellar Wormholes
Dokumen14 halaman
Visualizing Interstellar Wormholes
Francisco
Belum ada peringkat
Biogen 2021
Dokumen12 halaman
Biogen 2021
taufiq hid
Belum ada peringkat
Steam Drive Correlation and Prediction PDF
Dokumen10 halaman
Steam Drive Correlation and Prediction PDF
Emre Cengiz
Belum ada peringkat
Ibrahim Zeid: Rsrecial
Dokumen96 halaman
Ibrahim Zeid: Rsrecial
engrode
Belum ada peringkat
Timers, Serial Communication
Dokumen19 halaman
Timers, Serial Communication
Vyshnav P
Belum ada peringkat
Example 3 - S-Beam Crash
Dokumen13 halaman
Example 3 - S-Beam Crash
Santhosh Lingappa
Belum ada peringkat
Instrumentation Design UTHM
Dokumen5 halaman
Instrumentation Design UTHM
Anis Azwa
Belum ada peringkat
ASP Flashcards - Quizlet
Dokumen36 halaman
ASP Flashcards - Quizlet
Rehman Muzaffar
Belum ada peringkat
Reboilers and Vaporizers
Dokumen20 halaman
Reboilers and Vaporizers
58 - Darshan Shah
Belum ada peringkat
h6541 Drive Sparing Symmetrix Vmax WP
Dokumen19 halaman
h6541 Drive Sparing Symmetrix Vmax WP
santosh
Belum ada peringkat
Epoxy Hardeners, Water-Reducible: Products
Dokumen1 halaman
Epoxy Hardeners, Water-Reducible: Products
Dhruv Sevak
Belum ada peringkat
c1
Dokumen19 halaman
c1
vgnaga
Belum ada peringkat