intel
diff --git a/‎Makefile
Lines changed: 4 additions & 2 deletions b/‎Makefile
Lines changed: 4 additions & 2 deletions
diff --git a/‎Makefile.mkldnn
Lines changed: 1 addition & 1 deletion b/‎Makefile.mkldnn
Lines changed: 1 addition & 1 deletion
diff --git a/‎cmake/Dependencies.cmake
Lines changed: 11 additions & 0 deletions b/‎cmake/Dependencies.cmake
Lines changed: 11 additions & 0 deletions
diff --git a/‎cmake/MKLDNN.cmake
Lines changed: 9 additions & 2 deletions b/‎cmake/MKLDNN.cmake
Lines changed: 9 additions & 2 deletions
diff --git a/‎examples/LRCN_activity_recognition/train_test_singleFrame_RGB.prototxt
Lines changed: 0 additions & 2 deletions b/‎examples/LRCN_activity_recognition/train_test_singleFrame_RGB.prototxt
Lines changed: 0 additions & 2 deletions
diff --git a/‎examples/pycaffe/tune_engine.py
Lines changed: 190 additions & 0 deletions b/‎examples/pycaffe/tune_engine.py
Lines changed: 190 additions & 0 deletions
diff --git a/‎examples/pycaffe/tune_model.py
Lines changed: 99 additions & 0 deletions b/‎examples/pycaffe/tune_model.py
Lines changed: 99 additions & 0 deletions
diff --git a/‎include/caffe/data_reader.hpp
Lines changed: 1 addition & 0 deletions b/‎include/caffe/data_reader.hpp
Lines changed: 1 addition & 0 deletions
diff --git a/‎include/caffe/data_transformer.hpp
Lines changed: 5 additions & 0 deletions b/‎include/caffe/data_transformer.hpp
Lines changed: 5 additions & 0 deletions
@@ -77,11 +77,13 @@ ifeq ($(CAFFE_PER_LAYER_TIMINGS), 1)
 endif
 
 ifeq ($(CAFFE_MLSL_SHUFFLE), 1)
-        COMMON_FLAGS += -DCAFFE_MLSL_SHUFFLE
+	COMMON_FLAGS += -DCAFFE_MLSL_SHUFFLE
 endif
 
+ifeq ($(FW_OVERLAP_OPT), 1)
+	COMMON_FLAGS += -DFW_OVERLAP_OPT
+endif
 endif
-
 #################### MLSL ####################
 
 
 
@@ -32,7 +32,7 @@ mkldnn_download:
 
 mkldnn_build: mkldnn_download
 	cmake $(MKLDNN_CMAKE_FLAGS)
-	make -C $(CAFFE_ROOTDIR)/$(MKLDNN_BUILDDIR)
+	make -C $(CAFFE_ROOTDIR)/$(MKLDNN_BUILDDIR) -j$(shell cat /proc/cpuinfo |grep 'processor'|wc -l)
 	make -C $(CAFFE_ROOTDIR)/$(MKLDNN_BUILDDIR) install
 else
 mkldnn_download:
 
@@ -115,6 +115,17 @@ if(USE_MLSL)
   include_directories(SYSTEM "${MLSL_ROOT}/intel64/include")
   link_directories(SYSTEM "${MLSL_ROOT}/intel64/lib")
   list(APPEND Caffe_LINKER_LIBS mlsl)
+
+  if(CAFFE_PER_LAYER_TIMINGS)
+    add_definitions("-DCAFFE_PER_LAYER_TIMINGS")
+  endif()
+  if(CAFFE_MLSL_SHUFFLE)
+    add_definitions("-DCAFFE_MLSL_SHUFFLE")
+  endif()
+  if(FW_OVERLAP_OPT)
+    message(STATUS "Forward overlapping optimization is enabled!")
+    add_definitions("-DFW_OVERLAP_OPT")
+  endif()
 endif()
 
 # ---[ BLAS
 
@@ -8,7 +8,14 @@ function(Download_MKLDNN)
   execute_process(COMMAND cat mkldnn.commit
   		  WORKING_DIRECTORY ${CMAKE_SOURCE_DIR}
 		  OUTPUT_VARIABLE MKLDNN_COMMIT)
-  
+
+  include(ProcessorCount)
+  ProcessorCount(NCORE)
+  if(NOT NCORE EQUAL 0)
+      set(CTEST_BUILD_FLAGS -j${NCORE})
+      set(ctest_test_args ${ctest_test_args} PARALLEL_LEVEL ${NCORE})
+  endif()
+ 
   ExternalProject_add(MKLDNN_Build
                       SOURCE_DIR ${MKLDNN_SOURCE_DIR}
                       CMAKE_ARGS -DCMAKE_BUILD_TYPE=${CMAKE_BUILD_TYPE} -DCMAKE_INSTALL_PREFIX=${MKLDNN_INSTALL_DIR} -DMKLROOT=${MKL_ROOT_DIR}
@@ -20,7 +27,7 @@ function(Download_MKLDNN)
                       BUILD_COMMAND cmake ${MKLDNN_SOURCE_DIR}
 #--Install step
                       INSTALL_DIR ${MKLDNN_INSTALL_DIR}
-                      INSTALL_COMMAND make install
+                      INSTALL_COMMAND make install -j${NCORE}
                       LOG_CONFIGURE 1
                       LOG_BUILD 1
                       LOG_INSTALL 1
 
@@ -13,7 +13,6 @@ layer {
     mean_value: 103.939
     mean_value: 116.779
     mean_value: 123.68
-    flow: false
   }
   image_data_param {
     source: "ucf101_singleFrame_RGB_train_split1.txt"
@@ -38,7 +37,6 @@ layer {
     mean_value: 103.939
     mean_value: 116.779
     mean_value: 123.68
-    flow: false
   }
   image_data_param {
     source: "ucf101_singleFrame_RGB_test_split1.txt"
 
@@ -0,0 +1,190 @@
+import os
+import sys
+import copy
+import argparse
+
+from caffe.proto import caffe_pb2
+import google.protobuf.text_format as txtf
+
+def readFile(filePath):
+    lines = []
+    file = open(filePath, 'r')
+    for line in file.readlines():
+        lines.append(line)
+    file.close()
+
+    return lines
+
+def writeFile(filePath, lines):
+    file = open(filePath, 'w+')
+    file.write(lines)
+    file.close()
+
+def parseLog(log):
+    lines = readFile(log)
+    model_start = False
+    time_start = False
+    model_lines = []
+    time_lines = []
+    for line in lines:
+        trim_line = line.strip()
+        if trim_line.endswith("Initializing net from parameters:"):
+            model_start = True
+            continue
+        if model_start:
+            if trim_line.find("Creating layer") <> -1:
+                model_start = False
+                continue
+            model_lines.append(line)
+
+        if trim_line.endswith("Average time per layer:"):
+            time_start = True
+            continue
+        if time_start:
+            if trim_line.find("Average Forward pass") <> -1:
+                time_start = False
+                break
+            time_lines.append(line)
+
+    model_lines = model_lines[1:]
+    model_str = ""
+    for line in model_lines:
+        model_str = model_str + line
+
+    return (model_str, time_lines)
+
+def parseTimeLines(timeLines):
+    layer_map = {}
+    for line in timeLines:
+        trim_line = line.strip()
+        items = trim_line.split("\t")
+        layer_items = items[0].split(" ")
+        layer_name = layer_items[-1]
+        time_items = items[1].split(" ")
+        if layer_name not in layer_map.keys():
+            layer_map[layer_name] = (float)(time_items[1])
+        else:
+            layer_map[layer_name] = layer_map[layer_name] + (float)(time_items[1])
+
+    return layer_map
+
+def parseModelStr(modelStr):
+    net = caffe_pb2.NetParameter()
+    txtf.Merge(modelStr, net)
+    layer_model_map = {}
+    global_engine = "CAFFE"
+    if net.engine != "":
+        global_engine = net.engine
+    for index in range(0, len(net.layer)):
+        engine = global_engine
+        l = net.layer[index]
+        if l.engine != "":
+            engine = l.engine
+        param_engine = -1
+        if l.type == "Convolution" or l.type == "Deconvolution":
+            if l.convolution_param.engine != "":
+                param_engine = l.convolution_param.engine
+        elif l.type == "BatchNorm":
+            if l.batch_norm_param.engine != "":
+                param_engine = l.batch_norm_param.engine
+        elif l.type == "Concat":
+            if l.concat_param.engine != "":
+                param_engine = l.concat_param.engine
+        elif l.type == "Eltwise":
+            if l.eltwise_param.engine != "":
+                param_engine = l.eltwise_param.engine
+        elif l.type == "InnerProduct":
+            if l.inner_product_param.engine != "":
+                param_engine = l.inner_product_param.engine
+        elif l.type == "LRN":
+            if l.lrn_param.engine != "":
+                param_engine = l.lrn_param.engine
+        elif l.type == "Pooling":
+            if l.pooling_param.engine != "":
+                param_engine = l.pooling_param.engine
+        elif l.type == "ReLU":
+            if l.relu_param.engine != "":
+                param_engine = l.relu_param.engine
+
+        if param_engine == 0 or param_engine == 1:
+            engine = "CAFFE"
+        elif param_engine == 3:
+            engine = "MKL2017"
+        elif param_engine == 4:
+            engine = "MKLDNN"
+        layer_model_map[l.name] = (index, engine, l)
+
+    return (net, layer_model_map)
+
+def selectOptimalEngine(layers):
+    optimal_layer = None
+    min_time = sys.float_info.max
+    for layer in layers:
+        if layer[2] < min_time:
+            min_time = layer[2]
+            optimal_layer = layer
+
+    return optimal_layer
+
+def tuneEngine(logs, model):
+    if len(logs) <= 1:
+        print "[ERROR] Please specify two or more log files"
+        exit(1)
+
+    for log in logs:
+        if not os.path.exists(log):
+            print "[ERROR] Please specify valid log file:", log
+            exit(1)
+
+    layer_map = {}
+    net = None
+    for log in logs:
+        log_name = os.path.basename(log)
+        (model_str, time_lines) = parseLog(log)
+        (net, layer_model_map) = parseModelStr(model_str)
+        layer_time_map = parseTimeLines(time_lines)
+        for k, v in layer_model_map.items():
+            if k not in layer_map.keys():
+                layer_map[k] = [(v[0], v[1], layer_time_map[k], v[2])]
+            else:
+                layer_map_v = layer_map[k]
+                layer_map_v.append((v[0], v[1], layer_time_map[k], v[2]))
+                layer_map[k] = layer_map_v
+
+    optimal_layer_map = {}
+    for k, v in layer_map.items():
+        optimal_layer = selectOptimalEngine(v)
+        assert(optimal_layer != None)
+        optimal_layer_map[optimal_layer[0]] = optimal_layer[3]
+        
+    genModel(net, model, optimal_layer_map)
+
+def genModel(net, model, optimal_layer_map):
+    net_str = ""
+    net_str += "name: \"" + net.name + "\"\n"
+    for index in range(0, len(net.layer)):
+        net_str += "layer {\n"
+        l = net.layer[index]
+        if l.type.endswith("Data"):
+            net_str += str(l) + "\n}\n"
+            continue
+        l = optimal_layer_map[index]
+        net_str += str(l) + "\n}\n"
+    with open(model, 'w') as f:
+        net = caffe_pb2.NetParameter()
+        txtf.Merge(net_str, net)
+        f.write(str(net))
+        print "[INFO] Complete model engine tuning:", model
+
+if __name__ == '__main__':
+    parser = argparse.ArgumentParser()
+
+    parser.add_argument('-l', '--logs', nargs='+', help='require the caffe time logs', required=True)
+
+    parser.add_argument('-o', '--output', action='store', dest='output', default="",
+                        help='require the model output')
+
+    parser.add_argument('-v', '--version', action='version', version='%(prog)s 1.0')
+
+    params = parser.parse_args()
+    tuneEngine(params.logs, params.output)
@@ -0,0 +1,99 @@
+import os
+import datetime
+import copy
+import argparse
+
+from caffe.proto import caffe_pb2
+import google.protobuf.text_format as txtf
+import caffe
+
+def isWinogradApplicable(ic, oc, stride, kernel_size):
+    if ic % 16 != 0:
+        return False
+    if oc % 16 != 0:
+        return False
+    if stride != 1:
+        return False
+    if kernel_size != 3:
+        return False
+
+    return True
+
+def genHybridModel(net, winogradLayers, modelName):
+    newNet = copy.deepcopy(net)
+    newNetName = modelName.split(".")[0] + "_hybrid.prototxt"
+    for layer in winogradLayers:
+        newNet.layer[layer].convolution_param.conv_algorithm = "winograd"
+    with open(newNetName, 'w') as f:
+       f.write(str(newNet))
+       print "[INFO] Complete model tuning with Winograd:", newNetName
+
+def tuneModelDefinition(model):
+    net = caffe_pb2.NetParameter()
+    with open(model) as f:
+        s = f.read()
+        txtf.Merge(s, net)
+
+    net.name = 'Tuned model of ' + net.name
+    output_layer_map = {} 
+    for index in range(0, len(net.layer)):
+        l = net.layer[index]
+        if l.type == ("Convolution"):
+            stride = 0
+            kernel_size = 0
+            if len(l.convolution_param.stride) == 0:
+                stride = 1
+            else:
+                stride = l.convolution_param.stride[0]
+            kernel_size = l.convolution_param.kernel_size[0]
+            ic = 0
+            if l.bottom[0] in output_layer_map.keys():
+                ic = output_layer_map[l.bottom[0]][4]
+            oc = l.convolution_param.num_output
+            output_layer_map[l.name] = (index, stride, kernel_size, ic, oc, True)
+        elif l.type == ("InnerProduct"):
+            oc = l.inner_product_param.num_output
+            ic = 0
+            if l.bottom[0] in output_layer_map.keys():
+                ic = output_layer_map[l.bottom[0]][4]
+            output_layer_map[l.name] = (index, 0, 0, ic, oc, False)
+        elif l.type.endswith("Data") or l.type.endswith("Input"):
+            # TODO: correct the output
+            #    dynamic_net = caffe.Net(model, caffe.TEST)
+            #    for k, v in dynamic_net.blobs.items():
+            #        dynamic_net_map[k] = v.data.shape
+            ic = oc = 3
+            output_layer_map[l.name] = (index, 0, 0, ic, oc, False)
+        else:
+            ic = 0
+            if l.bottom[0] in output_layer_map.keys():
+                ic = output_layer_map[l.bottom[0]][4]
+            oc = ic
+            output_layer_map[l.name] = (index, 0, 0, ic, oc, False)
+
+    winograd_convolutions = []
+    for k,v in output_layer_map.items():
+        if v[5] and isWinogradApplicable(v[3], v[4], v[1], v[2]):
+            winograd_convolutions.append(v[0])
+
+    if len(winograd_convolutions) > 0:
+        genHybridModel(net, winograd_convolutions, model)
+    else:
+        print "[INFO] No need to tune model with Winograd:", model
+     
+if __name__ == '__main__':
+    parser = argparse.ArgumentParser()
+
+    parser.add_argument('-m', '--model', action='store', dest='model', default="",
+                        help='require the model definition (prototxt)')
+
+    parser.add_argument('-v', '--version', action='version', version='%(prog)s 1.0')
+
+    params = parser.parse_args()
+
+    model = params.model
+    if not os.path.exists(params.model):
+        print "[ERROR] Please specify the model definition file with -m"
+        exit(1)
+
+    tuneModelDefinition(model)
@@ -129,6 +129,7 @@ class DataReader {
 
     const LayerParameter param_;
     BlockingQueue<shared_ptr<QueuePair> > new_queue_pairs_;
+    bool first_read_;
 
     friend class DataReader;
 
 
@@ -396,6 +396,11 @@ class DataTransformer {
           bool has_mean_values>
   void Transform(const Datum& datum, Dtype* transformed_data,
                  NormalizedBBox* crop_bbox, RandNumbers& rand_num);
+
+#ifdef USE_OPENCV
+  void RandomResizeImage(const Datum& datum, Datum *resized_datum);
+  void RandomResizeImage(const cv::Mat& img, cv::Mat *resized_img);
+#endif
 };
 
 }  // namespace caffe