DynamoRIO · edeiana · Apr 11, 2024 · Apr 11, 2024 · Apr 12, 2024 · Apr 13, 2024
diff --git a/clients/drcachesim/CMakeLists.txt b/clients/drcachesim/CMakeLists.txt
@@ -165,13 +165,15 @@ add_exported_library(drmemtrace_opcode_mix STATIC tools/opcode_mix.cpp)
 add_exported_library(drmemtrace_syscall_mix STATIC tools/syscall_mix.cpp)
 add_exported_library(drmemtrace_view STATIC tools/view.cpp)
 add_exported_library(drmemtrace_func_view STATIC tools/func_view.cpp)
+add_exported_library(drmemtrace_record_view STATIC tools/record_view.cpp)
 add_exported_library(drmemtrace_invariant_checker STATIC tools/invariant_checker.cpp)
 add_exported_library(drmemtrace_schedule_stats STATIC tools/schedule_stats.cpp)
 
 target_link_libraries(drmemtrace_invariant_checker drdecode)
 
 configure_DynamoRIO_standalone(drmemtrace_opcode_mix)
 configure_DynamoRIO_standalone(drmemtrace_view)
+configure_DynamoRIO_standalone(drmemtrace_record_view)
 configure_DynamoRIO_standalone(drmemtrace_invariant_checker)
 
 # We combine the cache and TLB simulators as they share code already.
@@ -276,8 +278,8 @@ configure_DynamoRIO_standalone(drcachesim)
 target_link_libraries(drcachesim drmemtrace_simulator drmemtrace_reuse_distance
   drmemtrace_histogram drmemtrace_reuse_time drmemtrace_basic_counts
   drmemtrace_opcode_mix drmemtrace_syscall_mix drmemtrace_view drmemtrace_func_view
-  drmemtrace_raw2trace directory_iterator drmemtrace_invariant_checker
-  drmemtrace_schedule_stats drmemtrace_record_filter)
+  drmemtrace_record_view drmemtrace_raw2trace directory_iterator
+  drmemtrace_invariant_checker drmemtrace_schedule_stats drmemtrace_record_filter)
 if (UNIX)
     target_link_libraries(drcachesim dl)
 endif ()
@@ -357,6 +359,7 @@ install_client_nonDR_header(drmemtrace simulator/cache_simulator_create.h)
 install_client_nonDR_header(drmemtrace simulator/tlb_simulator_create.h)
 install_client_nonDR_header(drmemtrace tools/view_create.h)
 install_client_nonDR_header(drmemtrace tools/func_view_create.h)
+install_client_nonDR_header(drmemtrace tools/record_view_create.h)
 # TODO i#6412: Create a separate directory for non-tracer headers so that
 # we can more cleanly separate tracer and raw2trace code.
 install_client_nonDR_header(drmemtrace tracer/raw2trace.h)
@@ -578,6 +581,7 @@ restore_nonclient_flags(drmemtrace_opcode_mix)
 restore_nonclient_flags(drmemtrace_syscall_mix)
 restore_nonclient_flags(drmemtrace_view)
 restore_nonclient_flags(drmemtrace_func_view)
+restore_nonclient_flags(drmemtrace_record_view)
 restore_nonclient_flags(drmemtrace_record_filter)
 restore_nonclient_flags(drmemtrace_analyzer)
 restore_nonclient_flags(drmemtrace_invariant_checker)
@@ -644,6 +648,7 @@ add_win32_flags(drmemtrace_opcode_mix)
 add_win32_flags(drmemtrace_syscall_mix)
 add_win32_flags(drmemtrace_view)
 add_win32_flags(drmemtrace_func_view)
+add_win32_flags(drmemtrace_record_view)
 add_win32_flags(drmemtrace_record_filter)
 add_win32_flags(drmemtrace_analyzer)
 add_win32_flags(drmemtrace_invariant_checker)
@@ -821,8 +826,9 @@ if (BUILD_TESTS)
     drmemtrace_raw2trace drmemtrace_simulator drmemtrace_reuse_distance
     drmemtrace_histogram drmemtrace_reuse_time drmemtrace_basic_counts
     drmemtrace_opcode_mix drmemtrace_syscall_mix drmemtrace_view drmemtrace_func_view
-    drmemtrace_raw2trace directory_iterator drmemtrace_invariant_checker
-    drmemtrace_schedule_stats drmemtrace_analyzer drmemtrace_record_filter)
+    drmemtrace_record_view drmemtrace_raw2trace directory_iterator
+    drmemtrace_invariant_checker drmemtrace_schedule_stats drmemtrace_analyzer
+    drmemtrace_record_filter)
   if (UNIX)
     target_link_libraries(tool.drcachesim.core_sharded dl)
   endif ()

diff --git a/clients/drcachesim/analyzer_multi.cpp b/clients/drcachesim/analyzer_multi.cpp
@@ -64,6 +64,7 @@
 #include "tools/reuse_distance_create.h"
 #include "tools/reuse_time_create.h"
 #include "tools/view_create.h"
+#include "tools/record_view_create.h"
 #include "tools/loader/external_config_file.h"
 #include "tools/loader/external_tool_creator.h"
 #include "tools/filter/record_filter_create.h"
@@ -335,6 +336,8 @@ record_analyzer_multi_t::create_analysis_tool_from_options(
             op_filter_cache_size.get_value(), op_filter_trace_types.get_value(),
             op_filter_marker_types.get_value(), op_trim_before_timestamp.get_value(),
             op_trim_after_timestamp.get_value(), op_verbose.get_value());
+    } else if (simulator_type == RECORD_VIEW) {
+        return record_view_tool_create(op_skip_refs.get_value(), op_sim_refs.get_value());
     }
     ERRMSG("Usage error: unsupported record analyzer type \"%s\".  Only " RECORD_FILTER
            " is supported.\n",

diff --git a/clients/drcachesim/common/options.h b/clients/drcachesim/common/options.h
@@ -49,6 +49,7 @@
 #define SYSCALL_MIX "syscall_mix"
 #define VIEW "view"
 #define FUNC_VIEW "func_view"
+#define RECORD_VIEW "internal_record_view"
 #define INVARIANT_CHECKER "invariant_checker"
 #define SCHEDULE_STATS "schedule_stats"
 #define RECORD_FILTER "record_filter"

diff --git a/clients/drcachesim/common/trace_entry.cpp b/clients/drcachesim/common/trace_entry.cpp
@@ -35,6 +35,8 @@
 namespace dynamorio {
 namespace drmemtrace {
 
+/* Keep synched with trace_type_t enum in trace_entry.h.
+ */
 const char *const trace_type_names[] = {
     "read",
     "write",
@@ -88,5 +90,118 @@ const char *const trace_type_names[] = {
     "untaken_jump",
 };
 
+/* Keep synched with trace_version_t enum in trace_entry.h.
+ */
+const char *const trace_version_names[] = {
+    "<unknown>", "<unknown>",   "no_kernel_pc",        "kernel_pc",
+    "encodings", "branch_info", "frequent_timestamps",
+};
+
+/* Keep synched with trace_marker_type_t enum in trace_entry.h.
+ */
+const char *const trace_marker_names[] = {
+    "marker: kernel xfer",                    /* TRACE_MARKER_TYPE_KERNEL_EVENT */
+    "marker: syscall xfer",                   /* TRACE_MARKER_TYPE_KERNEL_XFER */
+    "marker: timestamp",                      /* TRACE_MARKER_TYPE_TIMESTAMP */
+    "marker: cpu id",                         /* TRACE_MARKER_TYPE_CPU_ID */
+    "marker: function",                       /* TRACE_MARKER_TYPE_FUNC_ID */
+    "marker: function return address",        /* TRACE_MARKER_TYPE_FUNC_RETADDR */
+    "marker: function argument",              /* TRACE_MARKER_TYPE_FUNC_ARG */
+    "marker: function return value",          /* TRACE_MARKER_TYPE_FUNC_RETVAL */
+    "marker: split value",                    /* TRACE_MARKER_TYPE_SPLIT_VALUE */
+    "marker: filetype",                       /* TRACE_MARKER_TYPE_FILETYPE */
+    "marker: cache line size",                /* TRACE_MARKER_TYPE_CACHE_LINE_SIZE */
+    "marker: instruction count",              /* TRACE_MARKER_TYPE_INSTRUCTION_COUNT */
+    "marker: version",                        /* TRACE_MARKER_TYPE_VERSION */
+    "marker: rseq abort",                     /* TRACE_MARKER_TYPE_RSEQ_ABORT */
+    "marker: window",                         /* TRACE_MARKER_TYPE_WINDOW_ID */
+    "marker: physical address",               /* TRACE_MARKER_TYPE_PHYSICAL_ADDRESS */
+    "marker: physical address not available", /* TRACE_MARKER_TYPE_PHYSICAL_ADDRESS_NOT_
+                                                 AVAILABLE */
+    "marker: virtual address",                /* TRACE_MARKER_TYPE_VIRTUAL_ADDRESS */
+    "marker: page size",                      /* TRACE_MARKER_TYPE_PAGE_SIZE */
+    "marker: system call idx",                /* TRACE_MARKER_TYPE_SYSCALL_IDX */
+    "marker: chunk instruction count",        /* TRACE_MARKER_TYPE_CHUNK_INSTR_COUNT */
+    "marker: chunk footer",                   /* TRACE_MARKER_TYPE_CHUNK_FOOTER */
+    "marker: record ordinal",                 /* TRACE_MARKER_TYPE_RECORD_ORDINAL */
+    "marker: filter endpoint",                /* TRACE_MARKER_TYPE_FILTER_ENDPOINT */
+    "marker: rseq entry",                     /* TRACE_MARKER_TYPE_RSEQ_ENTRY */
+    "marker: system call",                    /* TRACE_MARKER_TYPE_SYSCALL */
+    "marker: maybe-blocking system call",  /* TRACE_MARKER_TYPE_MAYBE_BLOCKING_SYSCALL */
+    "marker: trace start for system call", /* TRACE_MARKER_TYPE_SYSCALL_TRACE_START */
+    "marker: trace end for system call",   /* TRACE_MARKER_TYPE_SYSCALL_TRACE_END */
+    "marker: indirect branch target",      /* TRACE_MARKER_TYPE_BRANCH_TARGET */
+    "marker: system call failed",          /* TRACE_MARKER_TYPE_SYSCALL_FAILED */
+    "marker: direct switch to thread",     /* TRACE_MARKER_TYPE_DIRECT_THREAD_SWITCH */
+    "marker: wait for another core",       /* TRACE_MARKER_TYPE_CORE_WAIT */
+    "marker: core is idle",                /* TRACE_MARKER_TYPE_CORE_IDLE */
+    "marker: trace start for context switch", /* TRACE_MARKER_TYPE_CONTEXT_SWITCH_START */
+    "marker: trace end for context switch",   /* TRACE_MARKER_TYPE_CONTEXT_SWITCH_END */
+    "marker: vector length",                  /* TRACE_MARKER_TYPE_VECTOR_LENGTH */
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: unused",
+    "marker: reserved end", /* TRACE_MARKER_TYPE_RESERVED_END */
+};
+
 } // namespace drmemtrace
 } // namespace dynamorio
diff --git a/clients/drcachesim/common/trace_entry.h b/clients/drcachesim/common/trace_entry.h
@@ -44,6 +44,8 @@
 #define _TRACE_ENTRY_H_ 1
 
 #include <memory>
+#include <sstream>
+#include <string>
 #include <stddef.h>
 #include <stdint.h>
 
@@ -652,6 +654,8 @@ enum class func_trace_t : uint64_t { // VS2019 won't infer 64-bit with "enum {".
 };
 
 extern const char *const trace_type_names[];
+extern const char *const trace_version_names[];
+extern const char *const trace_marker_names[];
 
 /**
  * Returns whether the type represents an instruction fetch.
@@ -983,6 +987,121 @@ trace_arch_string(offline_file_type_t type)
                                                                       : "unspecified")));
 }
 
+/* Returns a string representation of marker type and corresponding marker value (if any)
+ * together.
+ */
+static inline std::string
+trace_marker_type_value_as_string(trace_marker_type_t marker_type, uintptr_t marker_value)
+{
+    std::stringstream ss;
+    const char *marker_name = trace_marker_names[marker_type];
+    switch (marker_type) {
+    /* Handle all the cases where marker_value doesn't matter.
+     */
+    case TRACE_MARKER_TYPE_FILTER_ENDPOINT:
+    case TRACE_MARKER_TYPE_MAYBE_BLOCKING_SYSCALL:
+    case TRACE_MARKER_TYPE_CORE_WAIT:
+    case TRACE_MARKER_TYPE_CORE_IDLE: ss << "<" << marker_name << ">\n"; break;
+
+    /* Handle all the cases where we simply print <marker_type marker_value>.
+     */
+    case TRACE_MARKER_TYPE_TIMESTAMP:
+    case TRACE_MARKER_TYPE_CPU_ID:
+    case TRACE_MARKER_TYPE_INSTRUCTION_COUNT:
+    case TRACE_MARKER_TYPE_CACHE_LINE_SIZE:
+    case TRACE_MARKER_TYPE_PAGE_SIZE:
+    case TRACE_MARKER_TYPE_CHUNK_INSTR_COUNT:
+    case TRACE_MARKER_TYPE_SYSCALL:
+    case TRACE_MARKER_TYPE_DIRECT_THREAD_SWITCH:
+    case TRACE_MARKER_TYPE_WINDOW_ID:
+    case TRACE_MARKER_TYPE_SYSCALL_IDX:
+        ss << "<" << marker_name << " " << marker_value << ">\n";
+        break;
+    /* Handle all the cases where we simply print <marker_type 0xmarker_value>.
+     */
+    case TRACE_MARKER_TYPE_FUNC_RETADDR:
+    case TRACE_MARKER_TYPE_FUNC_ARG:
+    case TRACE_MARKER_TYPE_FUNC_RETVAL:
+    case TRACE_MARKER_TYPE_RECORD_ORDINAL:
+    case TRACE_MARKER_TYPE_SPLIT_VALUE:
+    case TRACE_MARKER_TYPE_BRANCH_TARGET:
+        ss << "<" << marker_name << " 0x" << std::hex << marker_value << std::dec
+           << ">\n";
+        break;
+    /* Handle all remaining cases where we want to print a more informative output.
+     */
+    case TRACE_MARKER_TYPE_SYSCALL_TRACE_START:
+    case TRACE_MARKER_TYPE_SYSCALL_TRACE_END:
+        ss << "<" << marker_name << " number " << marker_value << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_CONTEXT_SWITCH_START:
+    case TRACE_MARKER_TYPE_CONTEXT_SWITCH_END:
+        ss << "<" << marker_name << " type " << marker_value << ">\n";
+        break;
+    /* We don't have a way to know the trace version here.  This might be an offset,
+     * but we don't make any distinction.
+     */
+    case TRACE_MARKER_TYPE_KERNEL_XFER:
+    case TRACE_MARKER_TYPE_KERNEL_EVENT:
+        ss << "<" << marker_name << " from 0x" << std::hex << marker_value << std::dec
+           << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_VERSION:
+        ss << "<" << marker_name << " " << static_cast<int>(marker_value) << " "
+           << trace_version_names[marker_value] << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_FILETYPE:
+        ss << "<" << marker_name << " 0x" << std::hex
+           << static_cast<intptr_t>(marker_value) << std::dec << " "
+           << trace_arch_string((offline_file_type_t)marker_value) << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_RSEQ_ABORT:
+        ss << "<" << marker_name << " from 0x" << std::hex << marker_value << std::dec
+           << " to handler>\n";
+        break;
+    case TRACE_MARKER_TYPE_RSEQ_ENTRY:
+        ss << "<" << marker_name << " with end at 0x" << std::hex << marker_value
+           << std::dec << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_CHUNK_FOOTER:
+        ss << "<" << marker_name << " #" << marker_value << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_PHYSICAL_ADDRESS:
+        ss << "<" << marker_name << " for following virtual: 0x" << std::hex
+           << marker_value << std::dec << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_VIRTUAL_ADDRESS:
+        ss << "<" << marker_name << " for prior physical: 0x" << std::hex << marker_value
+           << std::dec << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_PHYSICAL_ADDRESS_NOT_AVAILABLE:
+        ss << "<" << marker_name << " for 0x" << std::hex << marker_value << std::dec
+           << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_FUNC_ID:
+        if (marker_value >=
+            static_cast<intptr_t>(func_trace_t::TRACE_FUNC_ID_SYSCALL_BASE)) {
+            ss << "<" << marker_name << "==syscall #"
+               << (marker_value -
+                   static_cast<uintptr_t>(func_trace_t::TRACE_FUNC_ID_SYSCALL_BASE))
+               << ">\n";
+        } else {
+            ss << "<" << marker_name << " #" << marker_value << ">\n";
+        }
+        break;
+    case TRACE_MARKER_TYPE_SYSCALL_FAILED:
+        ss << "<" << marker_name << ": " << marker_value << ">\n";
+        break;
+    case TRACE_MARKER_TYPE_VECTOR_LENGTH:
+        ss << "<" << marker_name << " " << marker_value << " bytes>\n";
+        break;
+    default:
+        ss << "<marker: type " << marker_type << "; value " << marker_value << ">\n";
+        break;
+    }
+    return ss.str();
+}
+
 /* We have non-client targets including this header that do not include API
  * headers defining IF_X86_ELSE, etc.  Those don't need this function so we
  * simply exclude them.

diff --git a/clients/drcachesim/launcher.cpp b/clients/drcachesim/launcher.cpp
@@ -323,7 +323,8 @@ _tmain(int argc, const TCHAR *targv[])
             FATAL_ERROR("invalid -outdir %s", op_outdir.get_value().c_str());
         }
     } else {
-        if (op_simulator_type.get_value() == RECORD_FILTER) {
+        if (op_simulator_type.get_value() == RECORD_FILTER ||
+            op_simulator_type.get_value() == RECORD_VIEW) {
             record_analyzer = new record_analyzer_multi_t;
             if (!*record_analyzer) {
                 std::string error_string_ = record_analyzer->get_error_string();