2003 Digital Symposium Collection

SIGKDD03 - Research Track

Finding recent frequent itemsets adaptively over online data streams

Joong Hyuk Chang

Won Suk Lee

Generating English summaries of time series data using the Gricean maxims

Somayajulu Sripada

Ehud Reiter

Jim Hunter

Jin Yu

Mining unexpected rules by pushing user dynamics

Ke Wang

Yuelong Jiang

Laks V. S. Lakshmanan

Accurate decision trees for mining high-speed data streams

Joao Gama

Ricardo Rocha

Pedro Medas

Nantonac collaborative filtering: recommendation based on order responses

Toshihiro Kamishima

Improving spatial locality of programs via data mining

Karlton Sequeira

Mohammed Javeed Zaki

Boleslaw K. Szymanski

Christopher D. Carothers

Distributed multivariate regression based on influential observations

Hang Yu

Ee-Chien Chang

Graph-based anomaly detection

Caleb C. Noble

Diane J. Cook

Screening and interpreting multi-item associations based on log-linear modeling

Xintao Wu

Daniel Barbará

Yong Ye

Maximizing the spread of influence through a social network

David Kempe

Jon M. Kleinberg

Éva Tardos

Navigating massive data sets via local clustering

Michael E. Houle

Mining concept-drifting data streams using ensemble classifiers

Haixun Wang

Wei Fan

Philip S. Yu

Jiawei Han

CLOSET+: searching for the best strategies for mining frequent closed itemsets

Jianyong Wang

Jiawei Han

Jian Pei

Applications of sampling and fractional factorial designs to model-free data squashing

William DuMouchel

Deepak K. Agarwal

Towards systematic design of distance functions for data mining applications

Charu C. Aggarwal

Mining phenotypes and informative genes from gene expression data

Chun Tang

Aidong Zhang

Jian Pei

Cross-training: learning probabilistic mappings between topics

Sunita Sarawagi

Soumen Chakrabarti

Shantanu Godbole

Mining data records in Web pages

Bing Liu

Robert L. Grossman

Yanhong Zhai

Privacy-preserving k-means clustering over vertically partitioned data

Jaideep Vaidya

Chris Clifton

PaintingClass: interactive construction, visualization and exploration of decision trees

Soon Tee Teoh

Kwan-Liu Ma

Aggregation-based feature invention and relational concept classes

Claudia Perlich

Foster J. Provost

Natural communities in large linked networks

John E. Hopcroft

Omar Khan

Brian Kulis

Bart Selman

Efficient data reduction with EASE

Hervé Brönnimann

Bin Chen

Manoranjan Dash

Peter J. Haas

Peter Scheuermann

Playing hide-and-seek with correlations

Chris Jermaine

Generative model-based clustering of directional data

Arindam Banerjee

Inderjit Dhillon

Joydeep Ghosh

Suvrit Sra

PROXIMUS: a framework for analyzing very high dimensional discrete-attributed datasets

Mehmet Koyutürk

Ananth Grama

Understanding captions in biomedical publications

William W. Cohen

Richard Wang

Robert F. Murphy

Mining high dimensional data for classifier knowledge

Raj Bhatnagar

Goutham Kurra

Wen Niu

Mining viewpoint patterns in image databases

Wynne Hsu

Jing Dai

Mong-Li Lee

A Web page prediction model based on click-stream tree representation of user behavior

Sule Gündüz

M. Tamer Özsu

Visualizing changes in the structure of data for exploratory feature selection

Elias Pampalk

Werner Goebl

Gerhard Widmer

Style mining of electronic messages for multiple authorship discrimination: first results

Shlomo Argamon

Marin Saric

Sterling S. Stein

Fragments of order

Aristides Gionis

Teija Kujala

Heikki Mannila

Indexing multi-dimensional time-series with support for multiple distance measures

Michail Vlachos

Marios Hadjieleftheriou

Dimitrios Gunopulos

Eamonn J. Keogh

Translation-invariant mixture models for curve clustering

Darya Chudova

Scott Gaffney

Eric Mjolsness

Padhraic Smyth

Interactive exploration of coherent patterns in time-series gene expression data

Daxin Jiang

Jian Pei

Aidong Zhang

CloseGraph: mining closed frequent graph patterns

Xifeng Yan

Jiawei Han

On computing, storing and querying frequent patterns

Guimei Liu

Hongjun Lu

Wenwu Lou

Jeffrey Xu Yu

Learning relational probability trees

Jennifer Neville

David Jensen

Lisa Friedland

Michael Hay

An iterative hypothesis-testing strategy for pattern discovery

Richard J. Bolton

Niall M. Adams

XRules: an effective structural classifier for XML data

Mohammed Javeed Zaki

Charu C. Aggarwal

Eliminating noisy information in Web pages for data mining

Lan Yi

Bing Liu

Xiaoli

Information-theoretic co-clustering

Inderjit S. Dhillon

Subramanyam Mallela

Dharmendra S. Modha

Efficiently handling feature redundancy in high-dimensional data

Lei Yu

Huan Liu

Efficient decision tree construction on streaming data

Ruoming Jin

Gagan Agrawal

Distributed cooperative mining for information consortia

Satoshi Morinaga

Kenji Yamanishi

Jun-ichi Takeuchi

SEWeP: using site semantics and a taxonomy to enhance the Web personalization process

Magdalini Eirinaki

Michalis Vazirgiannis

Iraklis Varlamis

To buy or not to buy: mining airfare data to minimize ticket purchase price

Oren Etzioni

Rattapoom Tuchinda

Craig A. Knoblock

Alexander Yates

Weighted Association Rule Mining using weighted support and significance framework

Feng Tao

Fionn Murtagh

Mohsen Farid

Using randomized response techniques for privacy-preserving data mining

Wenliang Du

Zhijun Zhan

Probabilistic discovery of time series motifs

Bill Yuan-chi Chiu

Eamonn J. Keogh

Stefano Lonardi

Correlating synchronous and asynchronous data streams

Sudipto Guha

Dimitrios Gunopulos

Nick Koudas

Classifying large data sets using SVMs with hierarchical clusters

Hwanjo Yu

Jiong Yang

Jiawei Han

Time and sample efficient discovery of Markov blankets and direct causal relations

Ioannis Tsamardinos

Constantin F. Aliferis

Alexander R. Statnikov

Adaptive duplicate detection using learnable string similarity measures

Mikhail Bilenko

Raymond J. Mooney

Efficient elastic burst detection in data streams

Yunyue Zhu

Dennis Shasha

Algorithms for estimating relative importance in networks

Scott White

Padhraic Smyth

Empirical comparisons of various voting methods in bagging

Kelvin T. Leung

Douglas Stott Parker Jr

A bag of paths model for measuring structural similarity in Web documents

Sachindra Joshi

Neeraj Agrawal

Raghu Krishnapuram

Sumit Negi

Assessment and pruning of hierarchical model based clustering

Jeremy Tantrum

Alejandro Murua

Werner Stuetzle

Fast vertical mining using diffsets

Mohammed Javeed Zaki

Karam Gouda

Online novelty detection on temporal sequences

Junshui Ma

Simon Perkins

Extracting semantics from data cubes using cube transversals and closures

Alain Casali

Rosine Cicchetti

Lotfi Lakhal

Experiments with random projections for machine learning

Dmitriy Fradkin

David Madigan

Mining distance-based outliers in near linear time with randomization and a simple pruning rule

Stephen D. Bay

Mark Schwabacher

On detecting differences between groups

Geoffrey I. Webb

Shane M. Butler

Douglas A. Newlands

Carpenter: finding closed patterns in long biological datasets

Feng Pan

Gao Cong

Anthony K. H. Tung

Jiong Yang

Mohammed Javeed Zaki

Inverted matrix: efficient discovery of frequent items in large datasets in the context of interactive mining

Mohammad El-Hajj

Osmar R. Zaïane

A two-way visualization method for clustered data

Yehuda Koren

David Harel

Return to SIGKDD03 session listing