Selamat datang di Scribd!

Datamining Intro IEP 2

Diunggah oleh

aslam2001in

0% menganggap dokumen ini bermanfaat (0 suara)

18 tayangan16 halaman

Data mining is semi-automatically analyzing large databases to find patterns that are: valid: hold on new data with some certainity novel: useful: should be possible to act on the item understandable: humans should be able to interpret the pattern Also known as Knowledge Discovery in databases (kdd) Applications Banking: loan / credit card approval predict good customers based on old customers Customer relationship management: identify those who are likely to leave for a competitor.

Deskripsi Asli:

Hak Cipta

Format Tersedia

PPT, PDF, TXT atau baca online dari Scribd

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Laporkan Dokumen Ini

Hak Cipta:

Attribution Non-Commercial (BY-NC)

Format Tersedia

Unduh sebagai PPT, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

0% menganggap dokumen ini bermanfaat (0 suara)

18 tayangan16 halaman

Datamining Intro IEP 2

Diunggah oleh

aslam2001in

Hak Cipta:

Attribution Non-Commercial (BY-NC)

Format Tersedia

Unduh sebagai PPT, PDF, TXT atau baca online dari Scribd

Tandai sebagai konten tidak pantas

Lompat ke Halaman

Anda di halaman 1dari 16

Cari di dalam dokumen

HITKARINI COLLAGE OF ENGGNERING AND TECHNOLOGY

Data mining
Process of semi-automatically analyzing large databases to find patterns that are:
valid: hold on new data with some certainity novel: non-obvious to the system useful: should be possible to act on the item understandable: humans should be able to interpret the pattern

Also known as Knowledge Discovery in Databases (KDD)

Applications
Banking: loan/credit card approval
predict good customers based on old customers

Customer relationship management:

identify those who are likely to leave for a competitor.

Targeted marketing:
identify likely responders to promotions

Manufacturing and production:

automatically adjust knobs when process parameter changes

Applications
Medicine: disease outcome, effectiveness of treatments
analyze patient disease history: find relationship between diseases

Scientific data analysis:

identify new galaxies by searching for sub clusters

Web site/store design and promotion:

find affinity of visitor to pages and modify layout

The KDD process

Data collection
subset data: sampling might hurt if highly skewed data feature selection: principal component analysis, heuristic search

Pre-processing: cleaning
name/address cleaning, different meanings (annual, yearly), duplicate removal, supplying missing values

Transformation:
map complex objects e.g. time series data to features e.g. frequency Choosing mining task and mining method: Result evaluation and Visualization:

Some basic operations

Predictive:
Regression Collaborative Filtering

Descriptive:
Clustering / similarity matching Association rules and variants Deviation detection

Clustering
Unsupervised learning when old data with class labels not available e.g. when introducing a new product. Group/cluster existing customers based on time series of payment history such that similar customers in same cluster. Key requirement: Need a good measure of similarity between instances.

Identify micro-markets and develop policies for each

Clustering methods
Hierarchical clustering
agglomerative Vs divisive single link Vs complete link

Partitional clustering
distance-based: K-means model-based: EM density-based:

Variants
High confidence may not imply high correlation

Use correlations. Find expected support and large departures from that interesting..
see statistical literature on contingency tables.

Still too many rules, need to prune...

Data Mining in Practice

Application Areas
Industry Finance Insurance Telecommunication Transport Consumer goods Data Service providers Utilities Application Credit Card Analysis Claims, Fraud Analysis Call record analysis Logistics management promotion analysis Value added data Power usage analysis

Data Mining works with Warehouse Data

Data Warehousing provides the Enterprise with a memory

Data Mining provides the Enterprise with intelligence

Mining market
Around 20 to 30 mining tool vendors Major tool players:
Clementine, IBMs Intelligent Miner, SGIs MineSet, SASs Enterprise Miner.

All pretty much the same set of tools Many embedded products:
fraud detection: electronic commerce applications, health care, customer relationship management: Epiphany

OLAP Mining integration

OLAP (On Line Analytical Processing)
Fast interactive exploration of multidim. aggregates. Heavy reliance on manual operations for analysis: Tedious and error-prone on large multidimensional data Ideal platform for vertical integration of mining but needs to be interactive instead of batch.

Data Mining in Use

The US Government uses Data Mining to track fraud A Supermarket becomes an information broker Basketball teams use it to track game strategy Cross Selling Target Marketing Holding on to Good Customers Weeding out Bad Customers

THANK

YOU

Anda mungkin juga menyukai

Rules For Classification Data Mining
Dokumen18 halaman
Rules For Classification Data Mining
aslam2001in
Belum ada peringkat
Itnm
Dokumen3 halaman
Itnm
aslam2001in
Belum ada peringkat
Hitkarini College of Engineering
Dokumen6 halaman
Hitkarini College of Engineering
aslam2001in
Belum ada peringkat
VPN Application
Dokumen1 halaman
VPN Application
aslam2001in
Belum ada peringkat
Lplannew
Dokumen3 halaman
Lplannew
aslam2001in
Belum ada peringkat
Data Mining Concepts 15061
Dokumen38 halaman
Data Mining Concepts 15061
aslam2001in
Belum ada peringkat
BE Short Schedule For Publication 2
Dokumen1 halaman
BE Short Schedule For Publication 2
raj10420
Belum ada peringkat
394 Project Explation
Dokumen86 halaman
394 Project Explation
aslam2001in
Belum ada peringkat
Railway Agents Allahabad
Dokumen1 halaman
Railway Agents Allahabad
aslam2001in
Belum ada peringkat
Optimal Merge
Dokumen1 halaman
Optimal Merge
aslam2001in
Belum ada peringkat
Access Point Fro All Dongle and Dat Card
Dokumen2 halaman
Access Point Fro All Dongle and Dat Card
aslam2001in
Belum ada peringkat
Basics of Data Mining
Dokumen8 halaman
Basics of Data Mining
aslam2001in
Belum ada peringkat
Algorithm Details
Dokumen2 halaman
Algorithm Details
aslam2001in
Belum ada peringkat
Middsa
Dokumen2 halaman
Middsa
aslam2001in
Belum ada peringkat
Database Question and Answers
Dokumen4 halaman
Database Question and Answers
aslam2001in
Belum ada peringkat
It-Syllabasdt-14 (1) 07 09 (5$6sem)
Dokumen24 halaman
It-Syllabasdt-14 (1) 07 09 (5$6sem)
kislaybokaro
Belum ada peringkat
5 Linear Block Codes
Dokumen29 halaman
5 Linear Block Codes
Suprit Paul
Belum ada peringkat
DBSCAN Clustering
Dokumen4 halaman
DBSCAN Clustering
aslam2001in
Belum ada peringkat
2-3 Trees Tyutorial
Dokumen19 halaman
2-3 Trees Tyutorial
aslam2001in
Belum ada peringkat
CCNA Day1
Dokumen199 halaman
CCNA Day1
stars7771
Belum ada peringkat
OOPS Through UML Lab Manual
Dokumen70 halaman
OOPS Through UML Lab Manual
sedimbi
Belum ada peringkat
Shoe Dog: A Memoir by the Creator of Nike
Dari Everand
Shoe Dog: A Memoir by the Creator of Nike
Phil Knight
Penilaian: 4.5 dari 5 bintang
4.5/5 (537)
Grit: The Power of Passion and Perseverance
Dari Everand
Grit: The Power of Passion and Perseverance
Angela Duckworth
Penilaian: 4 dari 5 bintang
4/5 (587)
Hidden Figures: The American Dream and the Untold Story of the Black Women Mathematicians Who Helped Win the Space Race
Dari Everand
Hidden Figures: The American Dream and the Untold Story of the Black Women Mathematicians Who Helped Win the Space Race
Margot Lee Shetterly
Penilaian: 4 dari 5 bintang
4/5 (890)
The Yellow House: A Memoir (2019 National Book Award Winner)
Dari Everand
The Yellow House: A Memoir (2019 National Book Award Winner)
Sarah M. Broom
Penilaian: 4 dari 5 bintang
4/5 (98)
The Little Book of Hygge: Danish Secrets to Happy Living
Dari Everand
The Little Book of Hygge: Danish Secrets to Happy Living
Meik Wiking
Penilaian: 3.5 dari 5 bintang
3.5/5 (399)
On Fire: The (Burning) Case for a Green New Deal
Dari Everand
On Fire: The (Burning) Case for a Green New Deal
Naomi Klein
Penilaian: 4 dari 5 bintang
4/5 (73)
The Subtle Art of Not Giving a F*ck: A Counterintuitive Approach to Living a Good Life
Dari Everand
The Subtle Art of Not Giving a F*ck: A Counterintuitive Approach to Living a Good Life
Mark Manson
Penilaian: 4 dari 5 bintang
4/5 (5794)
Never Split the Difference: Negotiating As If Your Life Depended On It
Dari Everand
Never Split the Difference: Negotiating As If Your Life Depended On It
Chris Voss
Penilaian: 4.5 dari 5 bintang
4.5/5 (838)
Elon Musk: Tesla, SpaceX, and the Quest for a Fantastic Future
Dari Everand
Elon Musk: Tesla, SpaceX, and the Quest for a Fantastic Future
Ashlee Vance
Penilaian: 4.5 dari 5 bintang
4.5/5 (474)
Yes Please
Dari Everand
Yes Please
Amy Poehler
Penilaian: 4 dari 5 bintang
4/5 (1891)
A Heartbreaking Work Of Staggering Genius: A Memoir Based on a True Story
Dari Everand
A Heartbreaking Work Of Staggering Genius: A Memoir Based on a True Story
Dave Eggers
Penilaian: 3.5 dari 5 bintang
3.5/5 (231)
Principles: Life and Work
Dari Everand
Principles: Life and Work
Ray Dalio
Penilaian: 4 dari 5 bintang
4/5 (599)
The Emperor of All Maladies: A Biography of Cancer
Dari Everand
The Emperor of All Maladies: A Biography of Cancer
Siddhartha Mukherjee
Penilaian: 4.5 dari 5 bintang
4.5/5 (271)
The Gifts of Imperfection: Let Go of Who You Think You're Supposed to Be and Embrace Who You Are
Dari Everand
The Gifts of Imperfection: Let Go of Who You Think You're Supposed to Be and Embrace Who You Are
Brene Brown
Penilaian: 4 dari 5 bintang
4/5 (1090)
The World Is Flat 3.0: A Brief History of the Twenty-first Century
Dari Everand
The World Is Flat 3.0: A Brief History of the Twenty-first Century
Thomas L. Friedman
Penilaian: 3.5 dari 5 bintang
3.5/5 (2219)
Team of Rivals: The Political Genius of Abraham Lincoln
Dari Everand
Team of Rivals: The Political Genius of Abraham Lincoln
Doris Kearns Goodwin
Penilaian: 4.5 dari 5 bintang
4.5/5 (234)
The Hard Thing About Hard Things: Building a Business When There Are No Easy Answers
Dari Everand
The Hard Thing About Hard Things: Building a Business When There Are No Easy Answers
Ben Horowitz
Penilaian: 4.5 dari 5 bintang
4.5/5 (344)
Devil in the Grove: Thurgood Marshall, the Groveland Boys, and the Dawn of a New America
Dari Everand
Devil in the Grove: Thurgood Marshall, the Groveland Boys, and the Dawn of a New America
Gilbert King
Penilaian: 4.5 dari 5 bintang
4.5/5 (265)
Fear: Trump in the White House
Dari Everand
Fear: Trump in the White House
Bob Woodward
Penilaian: 3.5 dari 5 bintang
3.5/5 (738)
Angela's Ashes: A Memoir
Dari Everand
Angela's Ashes: A Memoir
Frank McCourt
Penilaian: 4.5 dari 5 bintang
4.5/5 (440)
Rise of ISIS: A Threat We Can't Ignore
Dari Everand
Rise of ISIS: A Threat We Can't Ignore
Jay Sekulow
Penilaian: 3.5 dari 5 bintang
3.5/5 (137)
Steve Jobs
Dari Everand
Steve Jobs
Walter Isaacson
Penilaian: 4.5 dari 5 bintang
4.5/5 (806)
John Adams
Dari Everand
John Adams
David McCullough
Penilaian: 4.5 dari 5 bintang
4.5/5 (2409)
The Unwinding: An Inner History of the New America
Dari Everand
The Unwinding: An Inner History of the New America
George Packer
Penilaian: 4 dari 5 bintang
4/5 (45)
Bad Feminist: Essays
Dari Everand
Bad Feminist: Essays
Roxane Gay
Penilaian: 4 dari 5 bintang
4/5 (1015)
The Glass Castle: A Memoir
Dari Everand
The Glass Castle: A Memoir
Jeannette Walls
Penilaian: 4.5 dari 5 bintang
4.5/5 (1711)
Wolf Hall: A Novel
Dari Everand
Wolf Hall: A Novel
Hilary Mantel
Penilaian: 4 dari 5 bintang
4/5 (3811)
The Outsider: A Novel
Dari Everand
The Outsider: A Novel
Stephen King
Penilaian: 4 dari 5 bintang
4/5 (1839)
The Perks of Being a Wallflower
Dari Everand
The Perks of Being a Wallflower
Stephen Chbosky
Penilaian: 4.5 dari 5 bintang
4.5/5 (2099)
The Woman in Cabin 10
Dari Everand
The Woman in Cabin 10
Ruth Ware
Penilaian: 3.5 dari 5 bintang
3.5/5 (2322)
The Light Between Oceans: A Novel
Dari Everand
The Light Between Oceans: A Novel
M.L. Stedman
Penilaian: 4.5 dari 5 bintang
4.5/5 (789)
The Sympathizer: A Novel (Pulitzer Prize for Fiction)
Dari Everand
The Sympathizer: A Novel (Pulitzer Prize for Fiction)
Viet Thanh Nguyen
Penilaian: 4.5 dari 5 bintang
4.5/5 (119)
Little Women
Dari Everand
Little Women
Louisa May Alcott
Penilaian: 4 dari 5 bintang
4/5 (104)
Brooklyn: A Novel
Dari Everand
Brooklyn: A Novel
Colm Toibin
Penilaian: 3.5 dari 5 bintang
3.5/5 (1937)
A Man Called Ove: A Novel
Dari Everand
A Man Called Ove: A Novel
Fredrik Backman
Penilaian: 4.5 dari 5 bintang
4.5/5 (4609)
The Art of Racing in the Rain: A Novel
Dari Everand
The Art of Racing in the Rain: A Novel
Garth Stein
Penilaian: 4 dari 5 bintang
4/5 (4200)
Manhattan Beach: A Novel
Dari Everand
Manhattan Beach: A Novel
Jennifer Egan
Penilaian: 3.5 dari 5 bintang
3.5/5 (792)
A Tree Grows in Brooklyn
Dari Everand
A Tree Grows in Brooklyn
Betty Smith
Penilaian: 4.5 dari 5 bintang
4.5/5 (1929)
Sing, Unburied, Sing: A Novel
Dari Everand
Sing, Unburied, Sing: A Novel
Jesmyn Ward
Penilaian: 4 dari 5 bintang
4/5 (1103)
The Constant Gardener: A Novel
Dari Everand
The Constant Gardener: A Novel
John le Carre
Penilaian: 3.5 dari 5 bintang
3.5/5 (104)
Her Body and Other Parties: Stories
Dari Everand
Her Body and Other Parties: Stories
Carmen Maria Machado
Penilaian: 4 dari 5 bintang
4/5 (821)
Plagiarism - Report
Dokumen6 halaman
Plagiarism - Report
Dipesh Nagpal
Belum ada peringkat
Pakistan Labor Laws Course Work
Dokumen9 halaman
Pakistan Labor Laws Course Work
downloader2010
Belum ada peringkat
Assignment Case Study
Dokumen3 halaman
Assignment Case Study
Mairene Castro
Belum ada peringkat
The External Environment Affecting A British Airways
Dokumen13 halaman
The External Environment Affecting A British Airways
kunal lad
Belum ada peringkat
Maruti Suzuki Case Study - Group3
Dokumen10 halaman
Maruti Suzuki Case Study - Group3
Shivam
Belum ada peringkat
Chowking Analysis
Dokumen17 halaman
Chowking Analysis
ayanggg.2007
Belum ada peringkat
Safety Shoes Policy
Dokumen1 halaman
Safety Shoes Policy
Marlon Bernardo
Belum ada peringkat
Ek Akuntansi
Dokumen74 halaman
Ek Akuntansi
Esa Suly
Belum ada peringkat
Stratma 1.1
Dokumen4 halaman
Stratma 1.1
Patrick Alvin
Belum ada peringkat
Zeian Cover Revised
Dokumen13 halaman
Zeian Cover Revised
cherry vale
Belum ada peringkat
Market Retail Edelweiss 10.01.18 PDF
Dokumen310 halaman
Market Retail Edelweiss 10.01.18 PDF
Rohan Shah
Belum ada peringkat
Chapter 19 - Measuring Short-Run Organizational Performance
Dokumen42 halaman
Chapter 19 - Measuring Short-Run Organizational Performance
RizalMawardi
Belum ada peringkat
New Microsoft Office Word Document (2) .Doc Project Ipo
Dokumen27 halaman
New Microsoft Office Word Document (2) .Doc Project Ipo
somusmou
Belum ada peringkat
Director VP Program Manager in Raleigh NC Resume Mary Paige Forrester
Dokumen6 halaman
Director VP Program Manager in Raleigh NC Resume Mary Paige Forrester
MaryPaigeForrester
Belum ada peringkat
All Intermediate Chapter
Dokumen278 halaman
All Intermediate Chapter
Nigus Ayele
Belum ada peringkat
Digital Marketing Proposal for Udzungwa Falls Lodge
Dokumen25 halaman
Digital Marketing Proposal for Udzungwa Falls Lodge
Louis Fanuel
100% (1)
Harmonising SME accounting standards
Dokumen144 halaman
Harmonising SME accounting standards
Jahde Goncalves
Belum ada peringkat
Issues and Challenges of Indian Aviation Industry: A Case Study
Dokumen7 halaman
Issues and Challenges of Indian Aviation Industry: A Case Study
Jayant Kumar
Belum ada peringkat
Performance Management Finals
Dokumen2 halaman
Performance Management Finals
Hasan Ali Bokhari
Belum ada peringkat
SEC approval needed for merger validity
Dokumen2 halaman
SEC approval needed for merger validity
Glaiza Otaza
Belum ada peringkat
Developing A Supply Chain Disruption Analysis Model - Application of Colored Petri-Nets
Dokumen10 halaman
Developing A Supply Chain Disruption Analysis Model - Application of Colored Petri-Nets
mario2008
Belum ada peringkat
Quality Control
Dokumen3 halaman
Quality Control
mage
Belum ada peringkat
Layer Business Plan
Dokumen15 halaman
Layer Business Plan
Humphrey
67% (3)
Answers
Dokumen9 halaman
Answers
Sandip Agarwal
Belum ada peringkat
CSR Aditya Birla Group 00023
Dokumen40 halaman
CSR Aditya Birla Group 00023
abhishek
Belum ada peringkat
Accounting Cycle Exercise Answer
Dokumen9 halaman
Accounting Cycle Exercise Answer
Raziel Jangas
100% (1)
Iso 9000 - Quality Handbook
Dokumen331 halaman
Iso 9000 - Quality Handbook
Javier Pozo Santana
92% (13)
The Fast Forward MBA in Project Management
Dokumen19 halaman
The Fast Forward MBA in Project Management
المهندسالمدني
0% (1)
2021 TOPIC 2 Contract Administration Functions
Dokumen18 halaman
2021 TOPIC 2 Contract Administration Functions
MUSLIHAH AQILAH MUSAFFENDY
Belum ada peringkat
Procurement-Management-Plan Doc 1
Dokumen10 halaman
Procurement-Management-Plan Doc 1
api-338883409
Belum ada peringkat