A methodology to make accurate preliminary - ETH E

DISS. ETH NO. 22313
A METHODOLOGY TO MAKE ACCURATE PRELIMINARY
ESTIMATES OF CONSTRUCTION MATERIAL QUANTITIES
FOR CONSTRUCTION PROJECTS
A thesis submitted to attain the degree of
DOCTOR OF SCIENCES of ETH ZURICH
(Dr. sc. ETH Zurich)
presented by
BORJA GARCÍA DE SOTO LASTRA
M.Sc., University of California, Berkeley
M.Sc., Florida International University
B.Sc., Florida International University
born on 24.04.1977
citizen of
SPAIN / USA
accepted on the recommendation of
Prof. Dr. Bryan T. Adey
Dr. N. Dilum Fernando
Prof. Dr. James T. O’Connor
Mr. Rudy Blum
2014
Abstract
ABSTRACT
Preliminary cost estimates are the first thoughtful efforts to predict the cost of a project. These
estimates heavily influence the fate of a project as they are crucial during the initial decision-making
process. A great array of preliminary cost estimation methods have been developed for the different
types of construction industries. These estimates typically concentrate only on project costs (often a
single monetary value). Little attention has been given to the development of models for estimating the
construction material quantities (CMQs) needed for the different elements that comprise a project. If
the required CMQs can be accurately estimated, current unit costs can be included to determine the
project cost by creating a preliminary estimate with a clear separation between technical estimates
(quantities) and market fluctuations in prices (cost of materials and labor).
The objective of this doctoral thesis has been to develop a methodology that would allow project
estimators to make accurate preliminary estimates of the CMQs used in construction projects in a
consistent and systematic manner.
The proposed methodology consists of two distinct phases, the pre-estimation phase and the estimation
phase. The first phase includes data collection and preprocessing, identification of CMQ-relevant
structures, and a process for the development of estimation models using regression analysis (RA) and
neural networks (NNs), as well as an information criterion (i.e., performance metric) to select among
the different developed models. In the second phase, three basic concepts, learning, adjusting, and
estimating, are integrated by combining RA, NNs and case-based reasoning (CBR) in order to create a
hybrid CMQ estimation methodology. The proposed methodology is not only highly relevant, but also
a new contribution to the research areas related to the development of CMQ estimates and the
interaction and integration of different techniques in the development of estimation models. Most of
the merit of this doctoral thesis comes from the development of the different processes using existing
techniques to create the proposed methodology. These include processes that analytically (1)
investigate different regression techniques to make estimation models, (2) develop CMQ estimation
models using the most appropriate techniques, (3) investigate the best metric (i.e., performance metric)
to evaluate the developed model, (4) assess different elements of the CBR process (e.g., similarity
functions, adaptation process, similarity thresholds), and (5) incorporate different techniques in the
creation of estimation models.
The proposed methodology is set up in a way that takes the project estimator in a consistent and
systematic manner through all the necessary steps (from data collection and analysis to model
development and integration) required in the development of accurate CMQ estimation models.
Although the proposed methodology can be applied to construction projects in any industry, its
implementation and demonstration was mostly studied and illustrated with the preparation of
preliminary CMQ estimates for the structures involved during the manufacturing process of cement in
greenfield cement plant projects. Using storage structures and tall-frame structures in cement plant
projects, the proposed methodology was used to estimate the 234 CMQs from 102 structures (12
storage structures, 60 tall-frame structures (upper structure), and 30 tall-frame structures (foundation)).
The errors obtained ranged from -13% to 17%, with 72% of the estimated CMQs showing a
percentage error below ±5; all below the recommended accuracy ranges for Estimate Class 4
(generally -30% to +50% or ±20% in CH). The proposed methodology was compared with estimation
models developed using RA, NNs, and CBR. The results from this comparison show that the CMQ
estimates from the proposed methodology outperform the ones obtained with the other techniques.
This was clearly indicated by the lower mean average percentage errors (MAPEs) for the different
CMQs on the structure subtypes evaluated. For example, for the estimates of concrete in storage
xxix
Abstract
structure subtypes the proposed methodology had a MAPE of 3% vs. 29%, 9%, and 9% from the
regression, NN, and CBR models, respectively. The improved performance was also proved with the
statistical tests conducted. The null hypothesis that there was no difference between the absolute
errors from the proposed methodology and the other techniques was rejected in 90% of the tests
conducted. In the remaining 10% of the tests, the MAPEs from the proposed methodology were lower
than those from the other techniques but without a significant statistical difference (with α = 0.05).
Future research in this area should be headed towards the advancement in the development of CMQ
estimates (or resources in general) and the interaction and integration of different techniques in the
development of estimation models for construction projects.
xxx
Zusammenfassung
ZUSAMMENFASSUNG
Vorgängige Kostenschätzungen sind erste Bemühungen, die Projektkosten vorauszusagen. Diese
Schätzungen haben einen grossen Einfluss auf das Schicksal eines Projekts, da sie den ersten Phasen
des Entscheidungsprozesses ausschlaggebend sind. Eine Vielzahl von Methoden zur vorgängigen
Kostenschätzung sind bereits für die verschiedenen Sparten der Bauindustrie entwickelt worden.
Typischerweise konzentrieren sich diese Schätzungen auf die Projektkosten, welche oft als
alleinstehender Geldwert ausgedrückt sind. Bisher wurde der Entwicklung von Modellen zur
Schätzung der Baumaterialmenge (Engl.: Construction Material Quantities (CMQs)), welche für die
verschiedenen Elemente in einem Projekt benötigt werden, wenig Aufmerksamkeit beigemessen.
Wenn die benötigte Baumaterialmenge präzise geschätzt werden kann, können unter Berücksichtigung
der aktuellen Einheitskosten die Projektkosten über eine vorgängige Schätzung ermittelt werden, mit
einer klaren Unterteilung in technische Schätzungen (Quantität) und Marktpreisschwankungen
(Material- und Arbeitskosten).
Ziel dieser Arbeit war die Entwicklung einer Methodik, welche es Projektkalkulatoren erlaubt, auf
konsequente und systematische Weise präzise vorgängige Schätzungen der in einem Projekt
verwendeten Baumaterialmenge zu machen.
Die vorgeschlagene Methodik besteht aus zwei Phasen: Die Vorabschätzungsphase und die
Schätzungsphase. Die erste Phase umfasst die Datenerfassung und -vorverarbeitung, die Identifikation
von Strukturen, welche hinsichtlich Baumaterialmengen relevant sind, ein Vorgehen zur Entwicklung
von Schätzmodellen (welche Regressionsanalyse (RA) und Neuronale Netzwerke (NNs) verwenden)
sowie ein Informationskriterium (d.h. eine Leistungsmessgrösse) um zwischen den verschiedenen
entwickelten Modellen auszuwählen. In der zweiten Phase werden die drei Grundkonzepte Lernen,
Anpassung und Schätzung durch Kombination von RA, NNs und Case-based Reasoning (CBR) zu
einer hybriden Schätzungsmethodik für die Baumaterialmenge integriert.
Die vorgeschlagene Methodik ist relevant für die Entwicklung von CMQ-Schätzungen; ausserdem
liefert sie einen neuen Beitrag zu den Forschungsbereichen der Entwicklung von CMQ-Schätzungen
sowie der Interaktion und Integration von verschiedenen Techniken in der Entwicklung von
Schätzmodellen. Der Hauptverdienst dieser Arbeit besteht in der Entwicklung verschiedener Prozesse
unter Verwendung existierender Techniken zur Erschaffung der vorgeschlagenen Methodik. Dies
schliesst Prozesse ein, die analytisch (1) verschiedene Regressionstechniken zur Erstellung von
Schätzmodellen untersuchen, (2) CMQ-Schätzmodelle unter Verwendung der am besten geeigneten
Methode entwickeln, (3) die beste Kennzahl (d.h. Leistungsmessgrösse) zur Beurteilung des
entwickelten Modells eruieren, (4) verschiedene Elemente des CBR-Prozesses (z.B.
Ähnlichkeitsfunktionen, Anpassungsprozess, Ähnlichkeitsschwelle) bewerten und (5) verschiedene
Techniken zur Schaffung von Schätzmodellen einbeziehen.
Die vorgeschlagene Methodik ist so aufgebaut, dass sie den Projektkalkulator in einer konsistenten
und systematischen Weise durch alle notwendigen Schritte für die Entwicklung eines geeigneten
CMQ-Schätzmodells (von der Datenerfassung und -analyse bis zur Modellentwicklung und integration) führt.
Obwohl die vorgeschlagene Methodik auf Bauprojekte jeder Branche angewandt werden kann, wurde
ihre Umsetzung und Veranschaulichung hauptsächlich unter dem Ansatz von vorgängigen CMQSchätzungen für Strukturen, welche im Zementherstellungsprozess von neu geplanten Zementwerken
involviert sind, studiert und dargestellt. Unter Betrachtung von Speicherbauwerken und hohen
Skelettbauten in Zementwerkprojekten wurde die vorgeschlagene Methodik verwendet, um 234 CMQs
xxxi
Zusammenfassung
von 102 Strukturen (12 Speicherbauwerke, 60 hohe Skelettbauten (oberhalb Fundament) und 30 hohe
Skelettbauten (Fundament)) zu schätzen. Die Abweichungen lagen in einem Bereich von -13% bis
17% (72% der geschätzten CMQs mit einer prozentualen Abweichung kleiner als ±5) und somit alle
unterhalb des empfohlenen Genauigkeitsbereichs für die Schätzklasse 4 (grundsätzlich -30% bis +50%
oder ±20% in der Schweiz). Die vorgeschlagene Methodik wurde mit Schätzmodellen verglichen,
welche RA, NNs und CBR verwenden. Der Vergleich zeigt, dass die CMQ-Schätzungen mit der
vorgeschlagenen Methodik die Ergebnisse anderer Techniken übertreffen. Dies wurde durch den
kleineren Mittelwert der prozentualen Abweichungen (Engl.: mean average percentage errors
(MAPEs)) für die verschiedenen CMQs der betrachteten Strukturuntertypen deutlich. Als Beispiel
wurde bei der Schätzung der benötigten Betonmenge in Speicherbauwerksubtypen mit der
vorgeschlagenen Methodik ein MAPE von 3% gegenüber 29% (RA), 9% (NN) bzw. 9% (CBR)
erreicht. Die verbesserte Schätzung wurde ausserdem mit statistischen Tests geprüft, wobei die
Nullhypothese („Kein Unterschied zwischen den absoluten Fehlern der vorgeschlagenen Methode und
den der anderen Techniken“) in 90% der Tests verworfen wurde. In den restlichen 10% der Tests
waren die MAPEs aus der vorgeschlagenen Methodik kleiner als diejenigen der anderen Techniken.
Jedoch wurde dabei kein signifikanter statistischer Unterschied (mit α = 0.05) festgestellt.
Zukünftige Forschung in diesem Bereich sollte in Richtung der Verbesserung der Entwicklung von
CMQ-Schätzungen (oder Ressourcen im Allgemeinen) und der Interaktion und der Integration von
verschiedenen Techniken in die Entwicklung von Schätzmodellen von Bauprojekten durchgeführt
werden.
xxxii